Потребителски вход

Запомни ме | Регистрация
Постинг
09.03.2019 17:31 - ВСИЧКО Е ИНФОРМАЦИЯ ! - Голямата база данни за биологията. Част втора .
Автор: mastino Категория: Новини   
Прочетен: 375 Коментари: 1 Гласове:
2


Постингът е бил сред най-популярни в категория в Blog.bg
 Много специален термин, характеризиращ спецификата на настоящия етап в историята за  развитието на човека, е фразата Big Data или „База данни“ (накратко БД). Спецификата на епохата на Базата данни е повишената роля на дигиталните информационни технологии, които така или иначе задължително фигурират в процесите, които са в основата на научните изследвания, инфраструктурата и икономиката.

 

Тази, без преувеличение, всеобща “тенденция на Базата данни” сега ясно се проявява в много различни области - от комуникационните системи и управлението на производството до финансовата и банковата сфера, работата на шпионските служби за сигурност, филмовата индустрия и други развлечения. И разбира се стои в първите редици на науката, като според американската IDC целият обем база данни, съхраняван в електронни носители на Земята към 2020-2021 година ще бъде едва около 34,4 до максимум 40 секстибайта. Информацията налична и съхранявана в тялото на един човек е равна на 60-120 секстибайта (зетабайта).

По-конкретно, за биологията, един вид олицетворение на "как в нашия живот навлезе епохата на Базата данни" е работата по определяне последователността – т.е. пълното декодиране - на геномите на биологичните организми, от хората до най-малките бактерии и други едноклетъчни организми.

В по предните си публикации в блога  е отбелязано каква информация съдържа всяка клетка от организма ни, както в ядрото си, а така също и в морфогенетичното си поле. Информацията съдържаща се в една единствена клетка:

- на змия е 1021 секстибайта (зетабайта) много по-голяма, отколкото в човешката клетка;

- на земноводно е 1014-15  петабайта, т.е. няколко клетки от всяко земноводно имат памет, колкото най-мощния в света компютър Summit (САЩ), пуснат в експлоатация през юни 2018 г.

 

Преди двадесет години, когато учените току-що започнаха да изследват (секвенират, като секвениране означава декодиране, разшифроване на генома на даден организъм) човешкия геном, тази задача се смяташе за един от най-скъпите и амбициозни проекти, правени някога в историята на науката.

Тъй като по-голямата част от тази работа е осъществена само от няколко големи центрове за секвениране на планетата, такова оборудване, "геномни секвенсори", може да се сравни с огромните (и изключително скъпи) ускорители-колайдери (Големият адронен колайдер – LHC, Large Hadron Collider)  на експерименталната физика на частиците.

Но тогава, преди около 5-6 години, настъпи истински пробив в технологиите за секвениране на ДНК. Всъщност, стойността на оборудването започна да пада толкова бързо, че намаляването на цената за изследване на ДНК започна поевтиняване много по-бързо отколкото падането на цената на компютърните чипове, чиято производителност се увеличава непрекъснато.

 

Съответно, когато цената на технологията спадна, много лаборатории биха могли да си позволят да закупят собствения си геномен секвенсер (а често и не един). Така че досега в света вече има над 1000 центрове за секвениране, които имат поне един такъв инструмент. Е, в някои, най-вече не-бедни лаборатории, броят на секвенсорите вече е стотици.

Дори според тези цифри можем да си представим бързата скорост, с която планините от геномна информация започват да нарастват след това, което се изисква, освен „простото“ декодиране, много по-дълбок анализ и разбиране. Към днешна дата не само много и много хиляди човешки геноми, но и хиляди геноми на други различни организми, включително животни, растения и микроби, вече са били дешифрирани до последния ген.

Наред с всички тези впечатляващи данни, без съмнение, освен резултатите също толкова бързо нарастват и непростите проблеми. Освен това тези проблеми са както количествени, така и качествени.

За по-простия количествен компонент може да се уточни следното. Както мнозина, вероятно вече са в курса, геномът на всяко човешко същество наброява около 3 милиарда базови двойки (база – това  е буква в ДНК кода), които образуват около 20 000 наши гени. Това може да изглежда странно за външни лица, но човешкият геном е много по-прост от значително по-сложния геном на онези микроорганизми, които живеят в човешкото тяло. В частност микробите имат 100 милиарда бази и милиони гени в своя геном.

 

Така че, ако човешкият геном може лесно да бъде записан на един DVD, то тогава далеч не са прости проблемите, които започват с колекции от геноми на „по-прости” от човека същества. Дори за елементарното съхранение и натрупване (без анализи) на колекциите на декодираните геноми на тези микроорганизми, които живеят в телата ни, в океана, в почвата и навсякъде на планетата, са необходими много впечатляващи информационни складове или хранилища.

Публичните банки за данни с цел съхраняване на информацията от подобни геноми още днес се измерват с петабайти – тоест милиони гигабайта. И в общ план всички биолози в света сега дават около 15 петабайта нова генетична информация годишно. Ако някой изведнъж искаше да постави тези данни на обикновени DVD дискове, резултатният стек на диска би бил по-голям от 4 километра ...

 

И всичко това (време е да се подчертае!) се отнася само до данните, получени в процеса на секвениране на ДНК. Но биологията е постигнала не само революционен напредък в геномиката (направление в генетиката, което се занимава с изучаването на човешкия геном), но и не по-малко забележителни резултати в други високотехнологични области, като например напреднали технологии за получаване на изображения с висока резолюция (компютърна томография, електронна микроскопия и др.).

С други думи, учените-биолози сега генерират данни не само със съкрушителна скорост, но и в умопомрачителни количества. А това означава, че науката биология, която преди 10 години изцяло се справяше с потока от научни данни, сега много бързо се озова в ситуация, в която изследователите вече не са в състояние да изолират и осъзнаят тази ценна информация, която внезапно им се предоставя в безпрецедентни гигантски обеми. (Много от преките участници в процеса честно формулират същността на ситуацията приблизително с тези думи: „Когато погледнем биологичните данни, ние дори не знаем точно какво виждаме тук!“).

 

Това всъщност е "качествената" страна на фундаменталните проблеми с големия обем данни в биологията. И за по-адекватно разбиране на неговия мащаб е желателно да се разбере, че е далеч от изучаването на човешкия геном и облака от микроби-бактерии, които постоянно го обитават (броят му е десетки пъти по-голям от броя на  човешките клетки).

 

В същото време биолозите трябва да се справят с гигантски масив от други важни проекти с голяма обработка на данни. Това включва усилия за анализиране на геномите на множество разновидности на онкологични заболявания и картографиране на човешкия мозък и много други, които са от съществено значение за нашето оцеляване - като например разработването на по-добри биогорива и здравословни зърнени храни. Не всеки може да е чул за него, но дори генома на такава важна култура като пшеницата в пет пъти повече превишава по своите размери генома на човека. И при това съдържа по шест копия на всяка хромозома - в сравнение с нашите две ...

Вероятно разбирате и осъзнавате, че дори тези – лежащи на повърхността (известни на научните среди от десетилетия) – факти дават много силен повод за това, да се замислим сериозно за природата и структурата на човека. Какво означава това явно несъответствие – когато „венеца (короната) на природата“ – Homo Sapiens има почти най-простата по структура ДНК сред всички обкръжаващи го организми? Все пак е ясно, че това е много странен парадокс, което означава, че със сигурност трябва да има някаква много интересна тайна, касаеща нашата структура и произход. Но уви, уви, на науката „биология” изобщо не  ѝ е до това.

Естествено, сред учените съществува разбирането, че титаничните усилия за събиране на големите Бази Данни ежегодно и ежедневно генерират такива масиви от информация, че науката просто няма време за смилане и обработка. Но, въпреки че данните, които вече съществуват и са натрупани, не са правилно осмислени и неясно разбрани и интерпретирани, а основните парични потоци в науката отиват за финансиране на проекти, които генерират все по-внушителни масиви от нова информация!?!?!?. Както коментират тази ситуация запознатите с проблема: „Много по-лесно е да правите това, което вече правите – и в нарастващ мащаб, отколкото да се опитвате критично да разберете и осмислите постигнатото и ни дай Б.же да си задавате по-задълбочени въпроси !?!?” ...




Гласувай:
2



1. kolevdobri - Не знаех...
26.03.2019 16:51
...че сме по-тъпи от пшеничено зърно.
цитирай
Вашето мнение
За да оставите коментар, моля влезте с вашето потребителско име и парола.
Търсене

За този блог
Автор: mastino
Категория: Новини
Прочетен: 360374
Постинги: 194
Коментари: 583
Гласове: 269
Календар
«  Април, 2024  
ПВСЧПСН
1234567
891011121314
15161718192021
22232425262728
2930