Біокомп'ютери – чи є перспективи? Нові технології виробництва комп'ютерів

В даний час, коли кожен новий крок у вдосконаленні напівпровідникових технологій дається з великими труднощами, вчені шукають альтернативні можливості розвитку обчислювальних систем. Природний інтерес низки дослідницьких груп (серед них Оксфордський та Техаський університети, Массачусетський технологічний інститут, лабораторії Берклі, Сандія та Рокфеллера) викликали природні способи зберігання та обробки інформації в біологічних системах. Підсумком їх досліджень з'явився (або, точніше, ще тільки повинен з'явитися) гібрид інформаційних та молекулярних технологій та біохімії – біокомп'ютер. Йдуть розробки кількох типів біокомп'ютерів, що базуються на різних біологічних процесах. Це, насамперед, що у стадії розробки ДНК- і клітинні біокомп'ютери.

ДНК-комп'ютери

Як відомо, у живих клітинах генетична інформація закодована у молекулі ДНК (дезоксирибонуклеїнової кислоти). ДНК - це полімер, що складається з субодиниць, званих нуклеотидами. Нуклеотид являє собою комбінацію цукру (дезоксирибози), фосфату і одного з чотирьох азотистих підстав, що входять до складу ДНК: аденіну (А), тиміну (Т), гуаніну (G) і цитозину (C). Молекула ДНК утворює спіраль, що складається із двох ланцюгів, об'єднаних водневими зв'язками. При цьому основа одного ланцюга може з'єднуватися водневими зв'язками тільки з основою Т іншого ланцюга, а основа G - тільки з основою С. Тобто, маючи один з ланцюгів ДНК, завжди можна відновити будову другої. Завдяки цій фундаментальній властивості ДНК, що отримала назву комплементарності, генетична інформація може точно копіюватися і передаватися від материнських клітин до дочірніх. Реплікація молекули ДНК відбувається за рахунок роботи спеціального ферменту ДНК-полімерази. Цей фермент ковзає вздовж ДНК та синтезує на її основі нову молекулу, в якій усі підстави замінені на відповідні парні. Причому фермент починає працювати тільки якщо до ДНК прикріпився коротенький шматочок-затравка (праймер). У клітинах існує також споріднена з молекулою ДНК молекула матричної рибонуклеїнової кислоти (РНК). Вона синтезується спеціальним ферментом, що використовує як зразок один з ланцюгів ДНК, і комплементарна їй. Саме на молекулі РНК у клітині, як у матриці, з допомогою спеціальних ферментів і допоміжних чинників відбувається синтез білків. Молекула РНК хімічно стійкіша, ніж ДНК, тому експериментаторам з нею працювати зручніше. Послідовність нуклеотидів у ланцюзі ДНК/РНК визначає генетичний код. Одиницею генетичного коду – кодоном – є послідовність із трьох нуклеотидів.

Вчені вирішили спробувати за прикладом природи використовувати молекули ДНК для зберігання та обробки даних у біокомп'ютерах.

Першим був Леонард Едлмен з Університету Південної Каліфорнії (див.: “Molecular Computation of Solutions to Combinatorial Problems. Science, 1994, № 266, р. 1021), зумів вирішити завдання гамільтонова шляху. Суть її в тому, щоб знайти маршрут руху із заданими точками старту та фінішу між кількома містами (у даному випадку сім'ю), у кожному з яких дозволяється побувати лише один раз. "Дорожня мережа" є односпрямованим графом. Це завдання вирішується прямим перебором, проте зі збільшенням кількості міст складність її зростає експоненційно. Кожне місто Едлмен ідентифікувало унікальною послідовністю із 20 нуклеотидів. Тоді шлях між будь-якими двома містами складатиметься з другої половини кодуючої послідовності для точки старту і першої половини кодуючої послідовності для точки фінішу (молекула ДНК, як і вектор, має напрямок). Синтезувати такі послідовності сучасна молекулярна апаратура дозволяє дуже швидко. У результаті послідовність ДНК із рішенням становитиме 140 нуклеотидів (7x20).

Залишається тільки синтезувати та виділити таку молекулу ДНК. Для цього в пробірку міститься близько 100 трильйонів молекул ДНК, що містять всі можливі 20-нуклеотидні послідовності, що кодують міста та шляхи між ними. Далі за рахунок взаємного тяжіння нуклеотидів А-Т і G-C окремі ланцюжки ДНК зчіплюються один з одним випадковим чином, а спеціальний фермент лігаза зшиває короткі молекули, що утворюються, у більші утворення. При цьому синтезуються молекули ДНК, що відтворюють усі можливі маршрути між містами. Потрібно лише виділити їх ті, що відповідають шуканому рішенню.

Едлмен вирішив це завдання біохімічними методами, послідовно видаливши спочатку ланцюжки, які не починалися з першого міста - точки старту - і не закінчувалися місцем фінішу, потім ті, що містили понад сім міст або не містили хоча б одне. Легко зрозуміти, що будь-яка молекула ДНК, що залишилися після такого відбору, є рішенням завдання. (Докладніше див.: Боркус В. "ДНК - основа обчислювальних машин". PC Week / RE, № 29-30/99, с. 29).

Слідом за роботою Едлмена пішли інші. Ллойд Сміт з Університету Вісконсін вирішив за допомогою ДНК завдання доставки чотирьох сортів піци за чотирма адресами, яка мала на увазі 16 варіантів відповіді. Вчені з Прінстонського університету вирішили комбінаторне шахове завдання: за допомогою РНК знайшли правильний хід шахового коня на дошці з дев'яти клітин (всього їх 512 варіантів).

Річард Ліптон з Прінстона першим показав, як, використовуючи ДНК, кодувати двійкові числа та вирішувати проблему задоволення логічного вираження. Суть її в тому, що, маючи деякий логічний вираз, що включає n логічних змінних, потрібно знайти всі комбінації значень змінних, що виражають істинним. Завдання можна вирішити лише перебором 2n комбінацій. Всі ці комбінації легко закодувати за допомогою ДНК, а далі діяти за методикою Едлмена. Ліптон запропонував також спосіб злому шифру DES (американський криптографічний), що трактується як своєрідний логічний вираз (www.wisdom.weizmann.ac.il/users/udi/public_html/index.html). Першу модель біокомп'ютера, щоправда, у вигляді механізму із пластмаси, у 1999 р. створив Іхуд Шапіро з Вейцманівського інституту природничих наук. Вона імітувала роботу "молекулярної машини" в живій клітині, що збирає білкові молекули за інформацією з ДНК, використовуючи РНК як посередник між ДНК і білком.

А в 2001 р. Шапіро вдалося реалізувати модель у реальному біокомп'ютері (див. Programmable andautonomous computing machine made of biomoleciles, Nature, 2001, № 44, р. 430), який складався з молекул ДНК, РНК та спеціальних ферментів. Молекули ферменту виконували роль апаратного, а молекули ДНК – програмного забезпечення. При цьому в одній пробірці було близько трильйона елементарних обчислювальних модулів. В результаті швидкість обчислень могла досягати мільярда операцій за секунду, а точність - 99,8%.

Поки біокомп'ютер Шапіро може застосовуватися лише для вирішення найпростіших завдань, видаючи лише два типи відповідей: “істина” чи “брехня”. У проведених експериментах за цикл всі молекули ДНК паралельно вирішували єдине завдання. Однак потенційно вони можуть працювати одночасно над різними завданнями, тоді як традиційні ПК є по суті однозадачними.

Наприкінці лютого 2002 р. з'явилося повідомлення, що фірма Olympus Optical претендує на першість у створенні комерційної версії ДНК-комп'ютера, призначеного для генетичного аналізу. Машину було створено у співпраці з доцентом Токійського університету Акірою Тояма.

Комп'ютер, побудований Olympus Optical, має молекулярну та електронну складові. Перша здійснює хімічні реакції між молекулами ДНК, забезпечує пошук та виділення результату обчислень. Друга – обробляє інформацію та аналізує отримані результати.

Аналіз генів зазвичай виконується вручну і вимагає багато часу: у своїй формуються численні фрагменти ДНК і контролюється перебіг хімічних реакцій. "Коли ДНК-комп'ютер буде використовуватися для генетичного аналізу, завдання, які раніше виконувались протягом трьох днів, можна буде вирішувати за шість годин", - сказав співробітник Olympus Optical Сатоші Ікута.

У компанії сподіваються поставити технологію генетичного аналізу на основі ДНК-комп'ютера на комерційну основу. Вона знайде застосування в медицині та фармації. Вчені планують впроваджувати молекулярні наноустрою в тіло людини для моніторингу стану її здоров'я та синтезу необхідних ліків.

Можливостями біокомп'ютерів зацікавились і військові. Американське агентство з досліджень у галузі оборони DARPA виконує проект, який отримав назву Bio-Comp (Biological Computations, біологічні обчислення). Його мета – створення потужних обчислювальних систем на основі ДНК. Принагідно дослідники сподіваються навчитися керувати процесами взаємодії білків та генів. Для цього планується створити потужний симулятор Bio-SPICE, здатний засобами машинної графіки візуалізувати біомолекулярні процеси. Bio-SPICE планується розвивати за принципами відкритих вихідних джерел (open source). Програма розрахована п'ять років.

Клітинні комп'ютери

Ще одним цікавим напрямом є створення клітинних комп'ютерів. Для цієї мети ідеально підійшли б бактерії, якби в їхній геном вдалося включити якусь логічну схему, яка могла б активізуватися в присутності певної речовини. Такі комп'ютери дуже дешеві у виробництві. Їм не потрібна така стерильна атмосфера, як при виробництві напівпровідників. І одного разу запрограмувавши клітину, можна легко і швидко виростити тисячі клітин із такою самою програмою.

У 2001 р. американські вчені створили трансгенні мікроорганізми (тобто мікроорганізми зі штучно зміненими генами), клітини яких можуть виконувати логічні операції І та АБО.

Фахівці лабораторії Оук-Рідж, штат Теннессі, використали здатність генів синтезувати той чи інший білок під впливом певної групи хімічних подразників. Вчені змінили генетичний код бактерій Pseudomonas putida таким чином, що їхні клітини набули здатності виконувати прості логічні операції. Наприклад, при виконанні операції в клітину подаються дві речовини (по суті - вхідні операнди), під впливом яких ген виробляє певний білок. Тепер вчені намагаються створити з урахуванням цих клітин складніші логічні елементи, і навіть подумують можливості створення клітини, виконує паралельно кілька логічних операцій.

Потенціал біокомп'ютерів дуже великий. Порівняно із звичайними обчислювальними пристроями вони мають низку унікальних особливостей. По-перше, вони використовують не бінарний, а тернарний код (оскільки інформація в них кодується трійками нуклеотидів). По-друге, оскільки обчислення проводяться шляхом одночасного вступу в реакцію трильйонів молекул ДНК, вони можуть виконувати до 1014 операцій на секунду (щоправда, вилучення результатів обчислень передбачає кілька етапів дуже ретельного біохімічного аналізу та здійснюється набагато повільніше). По-третє, обчислювальні пристрої на основі ДНК зберігають дані із щільністю, що в трильйони разів перевищує показники оптичних дисків. І, нарешті, ДНК-комп'ютери мають виключно низьке енергоспоживання.

Однак у розробці біокомп'ютерів вчені зіткнулися з низкою серйозних проблем. Перша пов'язана зі зчитуванням результату - сучасні способи секвенування (визначення послідовності, що кодує) не досконалі: не можна за один раз секвенувати ланцюжки довжиною хоча б у кілька тисяч підстав. Крім того, це дуже дорога, складна та трудомістка операція.

Друга проблема – помилки у обчисленнях. Для біологів точність у 1% при синтезі та секвенуванні основ вважається дуже хорошою. Для ІТ вона неприйнятна: розв'язання задачі можуть загубитися, коли молекули просто прилипають до стінок судин; немає гарантій, що не виникнуть точкові мутації в ДНК, тощо. І ще – ДНК з часом розпадаються, і результати обчислень зникають на очах! А клітинні комп'ютери працюють повільно, і їх легко "збити з пантелику". З усіма цими проблемами вчені активно борються. Наскільки успішно – покаже час.

Біокомп'ютери не розраховані на широкий загал користувачів. Але вчені сподіваються, що вони знайдуть своє місце в медицині та фармації. Глава ізраїльської дослідницької групи професор Ехуд Шапіро впевнений, що у перспективі ДНК-наномашини зможуть взаємодіяти з клітинами людини, здійснювати спостереження за потенційними хвороботворними змінами та синтезувати ліки для боротьби з ними.

Нарешті, за допомогою клітинних комп'ютерів стане можливим поєднання інформаційних та біотехнологій. Наприклад, вони зможуть керувати хімічним заводом, регулювати біологічні процеси всередині людського організму, виробляти гормони та лікарські речовини та доставляти до певного органу необхідну дозу ліків.

Вже давно йдуть розмови про швидке досягнення межі напівпровідникової технології виробництва обчислювальних пристроїв. Зменшення розміру компонентів інтегральної схеми до 80-120 нм призведе до появи низки проблем, пов'язаних із фізичною природою напівпровідникових наночастинок. По-перше, концентрацію допирующих напівпровідниковий кристал елементів вже не можна вважати однаковою у всьому обсязі. По-друге, різко збільшиться ймовірність тунельного електронного витоку (простіше кажучи, замикання) між компонентами інтегральної схеми. Наслідком цих двох причин стане зростання дефектних чіпів і недовговічність їх експлуатації (а, отже, і собівартість напівпровідникової продукції).

Бачачи настільки незавидні перспективи, багато відомих наукових інститутів та компаній (а серед них такі монстри, як Массачусетський технологічний інститут, лабораторії Сандія, IBM, Оксфордський університет) шукають нові принципи, нові фізичні основи для створення більш ефективних, ніж напівпровідникові, "лічильних машин" . Причому немає гарантії, що нові пристрої, що прийшли на заміну комп'ютерам, що працюють на електричній енергії, будуть хоча б віддалено нагадувати своїх попередників.

Однією з альтернатив сучасної напівпровідникової техніки у майбутньому можуть стати звані біологічні комп'ютери, чи біокомп'ютери. Біокомп'ютери є гібридом інформаційних технологій та біохімії. Дослідники з різних галузей науки (біології, фізики, хімії, генетики, інформатики) намагаються використати реальні біологічні процеси для створення штучних обчислювальних схем. Існує кілька різних типів біологічних комп'ютерів, заснованих на різних біологічних процесах: штучні нейронні ланцюги, еволюційне програмування, генні алгоритми, ДНК-комп'ютери і клітинні комп'ютери. Перші два стали досліджуватися ще на початку 40-х років, але досі ці дослідження ні до чого реально не привели. Останні три, засновані на методах генної інженерії, мають набагато більші перспективи, але робота в цих областях почалася лише п'ять років тому (особливо просунулися в цьому питанні Массачусетський технологічний інститут, лабораторії Берклі, лабораторії Рокфеллера та Техаський університет).

Якщо порівнювати потенційні можливості біокомп'ютера та звичайного комп'ютера, то перший значно випереджає свого теперішнього побратима. Щільність зберігання інформації в ДНК становить 1 біт/нм 2 - у трильйон разів менше, ніж у відеоплівки. ДНК може паралельно виконувати до 10 20 операцій на секунду - порівняно із сучасними терафлоповими суперкомп'ютерами. Крім ДНК (хоча ДНК-комп'ютер найбільш популярний серед розробників), як комп'ютерна біопам'ять можуть виступати інші біологічно активні молекули, наприклад, бактеріородопсин, що володіє чудовими голографічними властивостями і здатний витримувати високі температури. На його основі вже створено варіант тривимірного пристрою. Молекули бактеріородопсину фіксуються в гідрогелевій матриці та опромінюються двома лазерами (див. рис).

Перший лазер (спрямований аксіально на гідрогелевий зразок) ініціює фотохімічні реакції в молекулі та записує інформацію. Другий, спрямований перпендикулярно, зчитує інформацію, записану на молекулах бактероїродопсину, що знаходиться в об'ємі гідрогелю.

Принцип пристрою комп'ютерної ДНК-пам'яті заснований на послідовному з'єднанні чотирьох нуклеотидів (основних цеглин ДНК-ланцюга). Три нуклеотиди, з'єднуючись у будь-якій послідовності, утворюють елементарну комірку пам'яті - кодон, які потім формують ланцюг ДНК. Основна труднощі розробки ДНК-комп'ютерів пов'язані з проведенням виборчих однокодонних реакцій (взаємодій) всередині ланцюга ДНК. Проте прогрес є вже й у цьому напрямі. Вже є експериментальне обладнання, що дозволяє працювати з одним із 10 20 кодонів або молекул ДНК. Іншою проблемою є самоскладання ДНК, що призводить до втрати інформації. Її долають введенням у клітину спеціальних інгібіторів – речовин, що запобігають хімічній реакції самозшивки.

Створення біологічного ДНК-hardware планується здійснювати за допомогою методів генної інженерії, розмірні межі якої міста нижче літографічних. За допомогою біологічного "заліза" незабаром буде можливим здійснювати цифровий контроль за процесами, що протікають у людському організмі, та виконувати найпростіші математичні операції. Вченим з університету м. Вісконсін навіть вдалося провести обчислювальну операцію на молекулах ДНК, хімічно закріплених на гладкій інертній поверхні золота. Передача сигналів між молекулами ДНК здійснювалася за допомогою теплової енергії та хімічних речовин. Тім Гарднер із Бостона на прикладі бактерії кишкової палички (E-coli) сконструював цифровий перетворювач біохімічних сигналів, тривалість роботи якого становить 20 годин. Майкл Єловіц з Рокфеллерівського центру наукових досліджень зібрав генетичну послідовність, здатну в певних умовах відтворювати з певною частотою одну і ту ж біохімічну реакцію (варіант біологічного годинника). Група провідного фахівця в галузі ДНК-комп'ютерів Тома Кнайта з Массачусетського технологічного, експериментуючи з ДНК-зв'язаними протеїнами, створила біохімічний цифровий інвертор, в якому, якщо в біосистему ввести протеїн А(+), то на виході з системи вийде протеїн Б(-) і навпаки.

Іншим перспективним напрямом заміни напівпровідникових комп'ютерів створення клітинних (бактеріальних) комп'ютерів. Вони являють собою колонії різних "розумних" мікроорганізмів, що самоорганізуються (дуже нагадує бджіл, які організують упорядковану ієрархічну структуру всередині гнізда). Тобто, грубо кажучи, склянка з бактеріями і буде комп'ютером. Ці комп'ютери дуже дешеві у виробництві. Їм не потрібна така стерильна атмосфера як при виробництві напівпровідників. І одного разу запрограмувавши клітину, можна швидко виростити мільйон таких клітин із такою ж програмою.

За допомогою клітинних комп'ютерів стане можливим безпосереднє поєднання інформаційної технології та біотехнології. Вони керуватимуть хімічним (біохімічним) заводом, вони будуть робити для вас сорт пива, запрограмований вами, регулювати біологічні процеси всередині вашого організму (наприклад, виробляти інсулін). Клітинні біокомп'ютери матимуть змогу перевести обчислення на хімічну основу.

Основна проблема, з якою стикаються творці клітинних біокомп'ютерів, - організація всіх клітин у єдину діючу систему. На сьогоднішній день практичні досягнення в галузі клітинних комп'ютерів нагадують досягнення 20-х років у галузі лампових та напівпровідникових комп'ютерів. Зараз у Лабораторії штучного інтелекту Массачусетського технологічного університету створено клітину, здатну зберігати на генетичному рівні 1 біт інформації. Також розробляються технології, що дозволяють поодинокій бактерії відшукувати своїх сусідів, утворювати з ними впорядковану структуру та здійснювати масив паралельних операцій.

Як стало ясно шановному читачеві, створення біокомп'ютерів дуже перспективно, але й дуже складно. Поки що ніхто не може відповісти, який саме фізичний принцип замінить напівпровідникові технології (біокомп'ютери, квантові комп'ютери, оптичні комп'ютери або якісь ще). Але дослідження в галузі біокомп'ютерів все одно будуть продовжуватись, оскільки отримані результати важливі не тільки для створення біокомп'ютерів, але й для всієї біохімії загалом.

Дмитро ЩУКІН

НАЦІОНАЛЬНИЙ ДОСЛІДНИЙ
ЯДЕРНИЙ УНІВЕРСИТЕТ
МОСКІВСЬКИЙ ІНЖИНЕРНО-ФІЗИЧНИЙ ІНСТИТУТ
(НДЯУ МІФІ)
Факультет автоматики та електроніки, група А4-11


Біокомп'ютери

Виконала:
Студент групи А4-11
Потьомкіна Т.С.
Викладач:
Доцент Лапшинський В.А.


Москва 2011

Розділ 1. Біоінформатика
Розділ 2. Введення в історію біокомп'ютерів
2.1. Біокомп'ютери – що це?
2.2. Витоки. Розквіт біотехнології
2.3. Потенційні можливості
Розділ 3. Будова біокомп'ютера

3.3. Жива пам'ять
3.4. Начинка
Глава 4. Види біокомп'ютерів
4.1. ДНК-комп'ютери
4.2. Клітинні комп'ютери
Глава 5. Аргументи за та проти запровадження нової технології
Висновок
Список літератури

Глава 1
Біоінформатика

Історія розвитку біоінформатики як окремої науки дуже цікава. До неї існували дві інші науки: геноміка та протеоміка.
Геноміка – галузь біології, що вивчає гени людини. Десять років тому ніхто не міг повірити, що можна розшифрувати гени людини. В наш час геном людини повністю розшифровано, тому геноміка практично втратила своє значення.
З геноміки плавно випливає протеоміка - наука, яка вивчає білки, які у живих організмах. Саме протеоміка започаткувала біоінформатику, оскільки електронний аналіз речовини без “інтелектуального порівняння” зайняв би десятки, а то й сотні років. Наука, слід сказати, задля середніх умів.
Отже, біоінформатика. Сама наука з'явилася нещодавно наприкінці 90-х років. Спочатку вона займалася пошуком ліків з допомогою вивчення білкових ферментів. Якщо півстоліття тому вчені витрачали все життя, щоб вивчити структуру одного білка, то тепер лише за кілька годин реально оцінити 2,5 тисяч ферментів.
Значення цієї науки дуже велике. Наприклад, вакцину від вірусу гепатиту було знайдено завдяки біоінформатиці. За допомогою швидкого обстеження можна практично на 100% бути впевненим у правильності діагнозу або за кілька секунд визначити відсутність чи наявність в організмі заданого гена.
До речі, білок як жива речовина був обраний не випадково. З'ясувалося, що з синтезу амінокислот (а біоінформатика спочатку і призначалася цих цілей) білок найкраще розшифровує шукану комбінацію генів. До того ж, деякі білки зовсім невибагливі до зовнішніх впливів, хоч і реагують на будь-який зіткнення навіть із окремою молекулою сторонньої речовини.


Рис 1. «Модель біокомп'ютера»

Розділ 2
Введення в історію біокомп'ютерів

2.1. Біокомп'ютери – що це?


Біокомп'ютери є гібридом інформаційних технологій та біохімії. Дослідники з різних галузей науки (біології, фізики, хімії, генетики, інформатики) намагаються використати реальні біологічні процеси для створення штучних обчислювальних схем. Існує кілька різних типів біологічних комп'ютерів, заснованих на різних біологічних процесах: штучні нейронні ланцюги, еволюційне програмування, генні алгоритми, ДНК-комп'ютери і клітинні комп'ютери. Перші два стали досліджуватися ще на початку 40-х років, але досі ці дослідження, ні до чого реально працюючого не привели. Останні три, засновані на методах генної інженерії, мають набагато більші перспективи, але робота в цих областях почалася лише п'ять років тому (особливо просунулися в цьому питанні Массачусетський технологічний інститут, лабораторії Берклі, лабораторії Рокфеллера та Техаський університет).

2.2. Витоки. Розквіт біотехнології


Наприкінці 90-х років японці публікують надзвичайну новину: вперше у світі ведуться роботи зі створення біокомп'ютера, принцип дії якого заснований на біологічних датчиках. Раніше ніхто і подумати не міг про таку технологію, тому що для нормального функціонування живих організмів потрібна постійна підтримка необхідних умов (температури, обміну речовин тощо). Здавалося б, штучно створити такий організм неможливо, тож новина викликала велике здивування.
Після численних досліджень вчені вирішили використовувати як біодатчики білкові сполуки. Незважаючи на те, що підтримати їхню “живучість” вкрай складно, було знайдено вихід зі становища. Як показали експерименти, сферична молекула білка здатна витримувати неймовірні навантаження та бути невибагливою до будь-яких зовнішніх подразнень (у тому числі й хімічних). Особливість такого датчика - пружність, яка різна у всіх напрямках.


Рис 2. «Білкові сполуки»

2.3. Потенційні можливості


Якщо порівнювати потенційні можливості біокомп'ютера та звичайного комп'ютера, то перший значно випереджає свого теперішнього побратима. Щільність зберігання інформації в ДНК становить 1 біт/нм2 - у трильйон разів менше, ніж у відеоплівки. ДНК може паралельно виконувати до 1020 операцій на секунду - порівняно із сучасними терафлоповими суперкомп'ютерами. Крім ДНК (хоча ДНК-комп'ютер найбільш популярний серед розробників), як комп'ютерна біопам'ять можуть виступати інші біологічно активні молекули, наприклад, бактеріородопсин, що володіє чудовими голографічними властивостями і здатний витримувати високі температури. На його основі вже створено варіант тривимірного пристрою. Молекули бактеріородопсину фіксуються в гідрогелевій матриці та опромінюються двома лазерами (див. рис 1).


Рис 3. «Пристрій комп'ютерної біопам'яті»


Перший лазер (спрямований аксіально на гідрогелевий зразок) ініціює фотохімічні реакції в молекулі та записує інформацію. Другий, спрямований перпендикулярно, зчитує інформацію, записану на молекулах бактероїродопсину, що знаходиться в об'ємі гідрогелю.
Парадоксально, але за підрахунками, продуктивність аналогового біопроцесора невелика. Швидкість проходження сигналу по нервовому вузлу становить лише 20 м/c, що у перерахуванні цифровий еквівалент становить лише 10² операцій на секунду. Суперпотужні цифрові процесори здатні обробити до 10 до 9 операцій. Здавалося б, конкурувати з ними марно.
Але не все так погано. Коли йдеться, наприклад, про фіксацію градуса в напої, цифровий процесор не здатний її швидко виконати (навіть із звичайними механічними датчиками). Це з тим, що у молекулярному рівні частки взаємодіють між собою, породжуючи нові сполуки. Математичні розрахунки що неспроможні передбачити результат таких реакцій, тому час, затрачуване вивчення речовини, зростає в геометричній прогресії. Так що з математичною методикою приготування коктейлю із заданим смаком результат доведеться чекати тиждень, а то й більше.
Ось тут і показує себе аналоговий камінчик. Якщо на шматочку процесорної плівки розміром 1 см² буде міститися 10 до 12 активних білкових частинок, ми отримуємо колосальну продуктивність, що набагато перевищує можливості цифрового процесора. Так, наприклад, при пропусканні сигналу з датчика навіть з мінімальною швидкістю маємо близько 10 в 10 перемикань, що значно перевищує можливості електроніки. До того ж, жодних проблем із вирішенням завдання у процесора не виникає.
Визначивши наявність солодкої за смаком речовини, датчик подає певний сигнал. Його вловлює процесор, який трансформує показання біосенсора у цифровий формат. Знаючи Фон-Неймовську архітектуру, ти уявляєш, що камінь може працювати безпосередньо тільки з осередками пам'яті. У біокомп'ютері вона є і має назву оптичної або біопам'яті.
Довгий час вчені виводили таку білкову структуру, яка була здатна витримувати великі навантаження (вони були необхідні для запису даних). Коли, нарешті, підходящі ферменти було знайдено, стало цілком реальним створити біопам'ять, що містить у собі набагато більші обсяги інформації, ніж цифрові мізки.

Розділ 3
Будова біокомп'ютера

3.1. Архітектура біокомп'ютера


Представимо архітектуру найпростішого біокомп'ютера. Це низка біологічних сенсорів (датчиків), які реагують на зовнішній вплив. Зупинимося на датчиках докладніше. Існує чотири види датчиків, які використовуються в біокомп'ютерах. Всі вони необхідні для того, щоб забезпечити комп'ютер органами почуттів:

1. Хімічний. Аналог смакових рецепторів. Подібно до мови, хімічні датчики здатні вловлювати склад тієї чи іншої речовини, що пропускається через фермент. Таким чином, можна без проблем визначити, який інгредієнт буде додано до досліджуваної речовини: солодкий або гіркий;
2. Оптичний. Подібно до очей, білок може визначити вид речовини і навіть її форму. Це знову ж таки фіксується подальшими складовими біомашини. Завдяки такій фіксації комп'ютер реагує на роздратування належним чином;
3. МеханічнийДатчик служить для дотикових рефлексів. Завдяки такому сенсору машина може рухатися та приймати будь-які рішення після спрацювання інших датчиків;
4. Електричний сенсорслужить передачі сигналу з датчика на наступний компонент біокомп'ютера.

Цей компонент називається біопроцесором. Його завдання обробляти сигнал і перетворювати його на цифровий вигляд. У зворотному процесі він приймає сигнал з ЕОМ та передає його датчику (в аналоговому вигляді). І, нарешті, процесор взаємодіє з особливою структурою білка – біопам'яттю, яка здатна накопичувати колосальні обсяги інформації за гранично короткий час. Цифрова ЕОМ управляє механічними процесами (наприклад, припиняє подачу тієї чи іншої інгредієнта за його надлишку). Правильніше сказати, цифровий комп'ютер посилає сигнал механічному біодатчику, після якого комп'ютер належним чином реагує на подразнення.
Незважаючи на всю складність, біокомп'ютери почали розвиватися, і пік технології намічається лише через 30-50 років. Вже було проведено експерименти, результати яких свідчать, що створити автономний штучний інтелект (без електроніки) цілком реально.
Можна з упевненістю сказати, що у момент розквіту біоінформатики електронні ЕОМ стануть вчорашнім днем. Майже як лампові суперкомп'ютери у наш час. Звичайно, поряд з біотехнологіями візьмуть гору квантові та нейрокомп'ютери, які також є принципово новими розробками.

3.2. Архітектура біопроцесора

У пристрої біодатчика немає нічого складного. Усе підпорядковується правилам звичайного обчислювального процесу. Він складається з трьох кроків: отримання вхідних даних, обробка результатів та виконання будь-якого рішення.
Вводити дані з клавіатури дуже довго, саме тому придумали біодатчик, який займається прийомом вхідних даних. Як тільки відбувається зміна форми або кольору білка, це миттєво фіксує біопроцесор, який перетворює сигнал з аналогового на цифровий вигляд. Такий процесор складається із спеціального білкового розчину, який здатний безперервно змінювати свій стан. Це не що інше, як аналог транзисторного цифрового каменю. Частки білка миттєво змінюють свій стан (як правило, колір). Для нормального функціонування потрібен швидкий оборотний процес, тобто здатність частки повернути свій колишній стан. Вчені дуже довго шукали подібну структуру, проводячи багато довгих експериментів. Процес обробки інформації схожий на горіння бікфордова шнура - він продовжується, поки вся порохова начинка не вигорить. Уявіть собі, що порох має здатність автоматичного відновлення, а шнур замкнутий в кільце. При такому розкладі горіння буде вічним, що необхідно. Вчені довго йшли до створення такого процесора – підібрати потрібний склад білка було вкрай проблематично (пошук потрібної реакції розпочався з 1956 року).


Рис 4. «Модель біопроцесора»


Біопроцесор має три переваги, завдяки яким застосовується в архітектурі машини.

1. Швидкодія. Як уже було сказано, аналоговий камінчик миттєво приймає рішення, які не під силу цифровому процесору.
2. Надійність. Якщо кремнієвий процесор міг припускатися помилок при обчисленнях, біопроцесор практично не помиляється у своїх перетвореннях (максимальна відносна похибка коливається від 0,001 до 0,02%).
3. Компактність. Розміри дуже малі. Завдяки тому, що виробники навчилися нашарувати білкову структуру, габарити такого камінця можуть бути порівняні за розміром із краплею води.


Щоправда, біопроцесор має і недоліки. Насамперед це трудомістке виробництво, а також висока ціна.

3.3. Жива пам'ять


Дуже важливою складовою біокомп'ютера є машинна пам'ять. Вона також має білкову структуру, але вже більш невибагливу. Мікролазер, який прикріплений до плівки з ферментом, пропалює білок, змінюючи його властивості (знов-таки оборотний). Якщо підрахувати граничний обсяг такої пам'яті в цифровому форматі, то ми отримаємо цифру 1064 біт/см3, що дорівнює обсягу декількох десятків тисяч книг. Єдиний недолік такої пам'яті – її ціна та трудомістке виробництво.

3.4. Начинка


Дуже цікавим питанням є склад білкових сполук. У біодатчиках застосовуються білки з про архебактерій. Цей вид давно цікавив учених, оскільки мікроорганізми досить активно реагували будь-які зовнішні зміни, не втрачаючи своїх життєвих властивостей. Єдиним недоліком є ​​те, що останнім часом такі бактерії мутують у незрозумілі мікроорганізми (мабуть, дається взнаки екологія). Лише завдяки процесу клонування, вчені видобувають необхідну кількість “правильного” білка для мікродатчиків.


Рис 5. «Архебактерії»


Біопам'ять складається з найдрібніших частинок бактеріородопсину. Цей матеріал не має схильності до руйнування за високих температур, тому без проблем пропалюється лазером.

Рис 6. «Структура бактеріородопсину»

Розділ 4
Види біокомп'ютерів


Йдуть розробки кількох типів біокомп'ютерів, що базуються на різних біологічних процесах. Це, насамперед, що у стадії розробки ДНК- і клітинні біокомп'ютери.

4.1. ДНК-комп'ютери

Як відомо, у живих клітинах генетична інформація закодована у молекулі ДНК (дезоксирибонуклеїнової кислоти). ДНК - це полімер, що складається з субодиниць, званих нуклеотидами. Нуклеотид являє собою комбінацію цукру (дезоксирибози), фосфату і одного з чотирьох азотистих підстав, що входять до складу ДНК: аденіну (А), тиміну (Т), гуаніну (G) і цитозину. Молекула ДНК утворює спіраль, що складається із двох ланцюгів, об'єднаних водневими зв'язками. При цьому основа одного ланцюга може з'єднуватися водневими зв'язками тільки з основою Т іншого ланцюга, а основа G - тільки з основою С. Тобто, маючи один з ланцюгів ДНК, завжди можна відновити будову другої. Завдяки цій фундаментальній властивості ДНК, що отримала назву комплементарності, генетична інформація може точно копіюватися і передаватися від материнських клітин до дочірніх. Реплікація молекули ДНК відбувається за рахунок роботи спеціального ферменту ДНК-полімерази. Цей фермент ковзає вздовж ДНК та синтезує на її основі нову молекулу, в якій усі підстави замінені на відповідні парні. Причому фермент починає працювати тільки якщо до ДНК прикріпився коротенький шматочок-затравка (праймер). У клітинах існує також споріднена з молекулою ДНК молекула матричної рибонуклеїнової кислоти (РНК). Вона синтезується спеціальним ферментом, що використовує як зразок один з ланцюгів ДНК, і комплементарна їй. Саме на молекулі РНК у клітині, як у матриці, з допомогою спеціальних ферментів і допоміжних чинників відбувається синтез білків.


Рис 7. «Молекула ДНК»


Молекула РНК хімічно стійкіша, ніж ДНК, тому експериментаторам з нею працювати зручніше. Послідовність нуклеотидів у ланцюзі ДНК/РНК визначає генетичний код. Одиницею генетичного коду – кодоном – є послідовність із трьох нуклеотидів. Вчені вирішили спробувати за прикладом природи використовувати молекули ДНК для зберігання та обробки даних у біокомп'ютерах.


Рис 8. «Схема ДНК-комп'ютера»


Наприкінці лютого 2002 р. з'явилося повідомлення, що фірма Olympus Optical претендує на першість у створенні комерційної версії ДНК-комп'ютера, призначеного для генетичного аналізу. Машину було створено у співпраці з доцентом Токійського університету Акірою Тояма. Комп'ютер, побудований Olympus Optical, має молекулярну та електронну складові. Перша здійснює хімічні реакції між молекулами ДНК, забезпечує пошук та виділення результату обчислень. Друга – обробляє інформацію та аналізує отримані результати.
Аналіз генів зазвичай виконується вручну і вимагає багато часу: у своїй формуються численні фрагменти ДНК і контролюється перебіг хімічних реакцій. "Коли ДНК-комп'ютер буде використовуватися для генетичного аналізу, завдання, які раніше виконувались протягом трьох днів, можна буде вирішувати за шість годин", - сказав співробітник Olympus Optical Сатоші Ікута. У компанії сподіваються поставити технологію генетичного аналізу на основі ДНК-комп'ютера на комерційну основу. Вона знайде застосування в медицині та фармації. Вчені планують впроваджувати молекулярні наноустрою в тіло людини для моніторингу стану її здоров'я та синтезу необхідних ліків.

4.2. Клітинні комп'ютери

Ще одним цікавим напрямом є створення клітинних комп'ютерів. Для цієї мети ідеально підійшли б бактерії, якби в їхній геном вдалося включити якусь логічну схему, яка могла б активізуватися в присутності певної речовини. Такі комп'ютери дуже дешеві у виробництві. Їм не потрібна така стерильна атмосфера, як при виробництві напівпровідників. І одного разу запрограмувавши клітину, можна легко і швидко виростити тисячі клітин із такою самою програмою.
У 2001 р. американські вчені створили трансгенні мікроорганізми (тобто мікроорганізми зі штучно зміненими генами), клітини яких можуть виконувати логічні операції І/АБО.

Рис 9. «Клітка як комп'ютер»


Фахівці лабораторії Оук-Рідж, штат Теннессі, використали здатність генів синтезувати той чи інший білок під впливом певної групи хімічних подразників. Вчені змінили генетичний код бактерій Pseudomonas putida таким чином, що їхні клітини набули здатності виконувати прості логічні операції. Наприклад, при виконанні операції в клітину подаються дві речовини (по суті - вхідні операнди), під впливом яких ген виробляє певний білок. Тепер вчені намагаються створити з урахуванням цих клітин складніші логічні елементи, і навіть подумують можливості створення клітини, виконує паралельно кілька логічних операцій.

Розділ 5
Аргументи за та проти запровадження нової технології

Потенціал біокомп'ютерів дуже великий. Порівняно із звичайними обчислювальними пристроями вони мають низку унікальних особливостей. По-перше, вони використовують не бінарний, а тернарний код (оскільки інформація в них кодується трійками нуклеотидів). По-друге, оскільки обчислення проводяться шляхом одночасного вступу в реакцію трильйонів молекул ДНК, вони можуть виконувати до 1014 операцій на секунду (щоправда, вилучення результатів обчислень передбачає кілька етапів дуже ретельного біохімічного аналізу та здійснюється набагато повільніше). По-третє, обчислювальні пристрої на основі ДНК зберігають дані із щільністю, що в трильйони разів перевищує показники оптичних дисків. І, нарешті, ДНК-комп'ютери мають виключно низьке енергоспоживання.
Однак у розробці біокомп'ютерів вчені зіткнулися з низкою серйозних проблем. Перша пов'язана зі зчитуванням результату - сучасні способи секвенування (визначення послідовності, що кодує) не досконалі: не можна за один раз секвенувати ланцюжки довжиною хоча б у кілька тисяч підстав. Крім того, це дуже дорога, складна та трудомістка операція.
Друга проблема – помилки у обчисленнях. Для біологів точність у 1% при синтезі та секвенуванні основ вважається дуже хорошою. Для ІТ вона неприйнятна: розв'язання задачі можуть загубитися, коли молекули просто прилипають до стінок судин; немає гарантій, що не виникнуть точкові мутації в ДНК, тощо. І ще – ДНК з часом розпадаються, і результати обчислень зникають на очах! А клітинні комп'ютери працюють повільно, і їх легко "збити з пантелику". З усіма цими проблемами вчені активно борються. Наскільки успішно – покаже час.
Біокомп'ютери не розраховані на широкий загал користувачів. Але вчені сподіваються, що вони знайдуть своє місце у медицині та фармації. Глава ізраїльської дослідницької групи професор Ехуд Шапіро впевнений, що у перспективі ДНК-наномашини зможуть взаємодіяти з клітинами людини, здійснювати спостереження за потенційними хвороботворними змінами та синтезувати ліки для боротьби з ними.
Нарешті, за допомогою клітинних комп'ютерів стане можливим поєднання інформаційних та біотехнологій. Наприклад, вони зможуть керувати хімічним заводом, регулювати біологічні процеси всередині людського організму, виробляти гормони та лікарські речовини та доставляти до певного органу необхідну дозу ліків.

Висновок

Використання біокомп'ютера вже сьогодні можливе, доцільне і необхідне: у науці, освіті, у всіх системах управління, проектування, у процесах творення та творіння.
З його допомогою, наприклад, можна отримати повну інформацію про стан здоров'я кожного елемента свого організму, відхилення не від середньої норми, а від норми даної людини у відсотках і дізнатися про причину цих відхилень. Клієнт може зробити замовлення користувачеві біокомп'ютера по телефону, факсу з будь-якої точки земної кулі і таким же способом отримати роздруковану відповідь.
У спорті, мистецтві, шоу-бізнесі на прізвище, ім'я та по батькові можна отримати повну інформацію про успіх, можливості, сумісність з колективом кандидата, що купується в клуб або колектив. Фактично вже відкрито новий напрямок – геологія інтелектуальних ресурсів країн, і це найголовніше їхнє багатство.
Для великих об'єднань, корпорацій лише за допомогою біокомп'ютерних технологій можна розробити прогнози їх розвитку, виявити нові напрямки діяльності з урахуванням майбутніх реалій нашого світу. Дуже важливою обставиною при виконанні подібних робіт є те, що біокомп'ютерні технології не вимагають вихідної статистичної та комерційно закритої інформації.
Для вирішення наукових проблем біокомп'ютер замінить усі технічні засоби наукових проблемних лабораторій, залишивши вирішувати незначні прикладні завдання.
Біокомп'ютерні технології привабливі тим, що всі завдання вирішуються оперативно.
8. Кузнєцов Є. Ю., Осман В. М. Персональні комп'ютери та програмовані мікрокалькулятори: Навч. посібник для ВТУЗів - М: Вищ. шк. -1991

Московська Державна Академія Приладобудування та Інформатики

ДИПЛОМНА РОБОТА

з інформаційних економічних систем

«Біокомп'ютери»

Виконав: Пяров Тимур Р
ЕФ2, 2 курс, 35.14

2002
Москва
Зміст

Повністю біологічне. 3

У Німеччині створений перший у світі нейрочіп, що поєднує електронні елементи та нервові клітини.

Біологія in silico. 5

Інфузорне програмування. 8

Біоалгоритміка. 11

Біочіпи як приклад індустріальної біології. 17


Перший біокомп'ютер

Взявши нейрони равлика, вони закріпили їх на кремнієвому чіпі за допомогою мікроскопічних пластмасових власників ( на світлині). У результаті кожна клітина виявилася з'єднана як із сусідніми клітинами, і з чипом. Подаючи через чіп на певну клітину електричні імпульси, можна керувати всією системою.

)

Повністю біо

Група вчених з Вейцманівського Інституту (Weizmann Institute), Ізраїль, вдалося створити перший у світі комп'ютер, всі оброблювані дані та компоненти якого, включаючи "залізо", програми та систему введення-виведення, вміщуються в одній скляній пробірці. Фокус полягає в тому, що замість традиційних кремнієвих чіпів та металевих провідників новий комп'ютер складається з набору біомолекул – ДНК, РНК та деяких ферментів. При цьому ферменти (або, по-іншому, ензими) виступають у ролі "заліза", а програми та дані зашифровані собою парами молекул, що формують ланцюжки ДНК (на ілюстрації) .

За словами керівника проекту професора Ехуда Шапіро (Ehud Shapiro), біокомп'ютер поки що може вирішувати лише найпростіші завдання, видаючи всього два типи відповідей: "істина" або "брехня". При цьому в одній пробірці міститься одночасно до трильйона елементарних обчислювальних модулів, які можуть виконувати до мільярда операцій на секунду. Точність обчислень при цьому становитиме 99,8%. Для проведення обчислень необхідно попередньо змішати в пробірці речовини, що відповідають "залізу", "програмному забезпеченню" та вихідним даним, при цьому ферменти, ДНК і РНК провзаємодіють таким чином, що в результаті утворюється молекула, в якій зашифровано результат обчислень.

Коментуючи нове досягнення Шапіро повідомив, що природа надала людині чудові молекулярні машини для кодування та обробки даних, і хоча вчені ще не навчилися синтезувати такі машини самостійно, використання досягнень природи вже незабаром дозволить вирішити цю проблему. У майбутньому молекулярні комп'ютери можуть бути впроваджені в живі клітини, щоб оперативно реагувати на негативні зміни в організмі та запускати процеси синтезу речовин, здатних протистояти таким змінам. Крім цього, завдяки деяким своїм особливостям біокомп'ютери зможуть витіснити електронні машини з деяких галузей науки.

У Німеччині створено перший у світі нейрочіп, що поєднує електронні елементи та нервові клітини.

Групі вчених із мюнхенського Інституту біохімії імені Макса Планка вдалося створити перший у світі нейрочіп. Мікросхема, виготовлена ​​Пітером Фромгерцем і Гюнтером Зеком, поєднує в собі електронні елементи та нервові клітини.

Головною проблемою при створенні нейрочіпів завжди була складність фіксації нервових клітин дома. Коли клітини починають утворювати сполуки одна з одною, вони неминуче зміщуються. На цей раз вченим вдалося уникнути цього.

Взявши нейрони равлика, вони закріпили їх на кремнієвому чіпі за допомогою мікроскопічних пластмасових власників. У результаті кожна клітина виявилася з'єднана як із сусідніми клітинами, і з чипом. Подаючи через чіп на певну клітину електричні імпульси, можна керувати всією системою.

Поєднання біологічних та комп'ютерних систем таїть у собі величезний потенціал. На думку фахівців, нейрочіпи дозволять створити більш досконалі, здатні до навчання комп'ютери, а також протези для заміни пошкоджених ділянок мозку та високочутливі біосенсори.

Як заявив нещодавно знаменитий британський фізик Стівен Хокінг, якщо ми хочемо, щоб біологічні організми, як і раніше, перевершували електронні, нам доведеться пошукати спосіб об'єднати комп'ютери та людський мозок, або спробувати штучним шляхом удосконалити власні гени. ( Докладніше про це розповідається тут)

Втім, такі проекти поки що залишаються фантастикою. До їх реалізації поки що дуже далеко, а поки що головним призначенням пристроїв, подібних до створеної в Мюнхені нейросхеми, є вивчення механізмів роботи нервової системи та людської пам'яті.

Джерело:
Nature

Біологія in silico

Уобчислювальна біологія, вона ж біоінформатика, вона ж комп'ютерна генетика - молода наука, що виникла на початку 80-х років на стику молекулярної біології та генетики, математики (статистики та теорії ймовірності) та інформатики, що зазнала впливу лінгвістики та фізики полімерів. Поштовхом до цього послужила поява наприкінці 70-х років швидких методів секвенування послідовностей ДНК. Наростання обсягу даних відбувалося лавиноподібно (рис. 2) і незабаром стало зрозуміло, кожна отримана послідовність як цікавить як така (наприклад, з метою генної інженерії та біотехнології), а й набуває додаткового сенсу за порівнянню коїться з іншими. У 1982 році були організовані банки даних нуклеотидних послідовностей - GenBank у США та EMBL у Європі. Спочатку дані переносилися в банки зі статей вручну, проте, коли цей процес почав захлинатися, всі провідні журнали почали вимагати, щоб послідовності, згадані у статті, були поміщені в банк самими авторами. Більше того, оскільки секвенування вже давно стало рутинним процесом, який виконують роботи або студенти молодших курсів на лабораторних роботах, багато послідовностей зараз потрапляють до банків без публікації. Банки постійно обмінюються даними і, у цьому сенсі, практично рівноцінні, проте засоби роботи з ними, що розробляються в Центрі біотехнологічної інформації США та Європейському інституті біоінформатики, є різними. Мабуть, першим біологічно важливим результатом, отриманим за допомогою аналізу послідовностей, було виявлення схожості вірусного онкогену v-sisта нормального гена фактора зростання тромбоцитів, що призвело до значного прогресу у розумінні механізму раку. З того часу робота із послідовностями стала необхідним елементом лабораторної практики.

1995 року був секвенований перший бактеріальний геном*, 1997-го — геном дріжджів. У 1998 році було оголошено про завершення секвенування геному першого багатоклітинного організму - нематоди 1 . Станом на 1 вересня 2001 року доступно 55 геномів бактерій, геном дріжджів, практично повні геноми. Arabidopsis thaliana(Рослини, спорідненої гірчиці), нематоди, мухи дрозофіли – все це стандартні об'єкти лабораторних досліджень. Вже двічі (навесні 2000 та взимку 2001 року) було оголошено про практичне завершення секвенування геному людини – наявні фрагменти справді покривають його більш ніж на 90%. Кількість геномів, що знаходяться в розпорядженні фармацевтичних і біотехнологічних компаній, важко оцінити, хоча, мабуть, воно становить багато десятків і навіть сотні. Зрозуміло, що переважна більшість генів у цих геномах ніколи не буде експериментально досліджено. Тому комп'ютерний аналіз стає основним засобом вивчення.

Все це призвело до того, що біоінформатика стала надзвичайно модною галуззю науки, попит на фахівців якої дуже великий. Слід зазначити, що одним з неприємних наслідків шуму, що виник, стало те, що біоінформатикою називають все, де є біологія і комп'ютери 2 . У той же час багато областей вже пережили такі моменти (наприклад, теорія інформації 3), і хочеться сподіватися, що за піною ажіотажу не пропаде справді цікаве, що робиться в справжній біоінформатиці.

Традиційно до біоінформатики належить:

Статистичний аналіз послідовностей ДНК;

Пророцтво функції по послідовності (розпізнавання генів у послідовності ДНК, пошук регуляторних сигналів, передбачення функцій білків - деякі з цих завдань розглянуті в наступній статті);

Аналіз просторової структури білків та нуклеїнових кислот, у тому числі передбачення структури білка за послідовністю, - тут біоінформатика межує з біофізикою та фізикою полімерів;

Теорія молекулярної еволюції та систематика.

Слід зазначити, що багато завдань із різних галузей вирішуються подібними алгоритмами, одне із прикладів цього наводиться у статті М. А. Ройтберга.

В останні роки виникла низка нових завдань, пов'язаних з прогресом у галузі автоматизації не тільки секвенування, але й інших експериментальних методів: мас-спектрометрії, аналізу білок-білкових взаємодій, дослідження роботи генів у різних тканинах та умовах (див. статтю І.А. Григорян та В. Ю. Макєєва в цьому номері). При цьому не тільки виникає необхідність створювати та запозичувати з інших областей нові алгоритми (наприклад, для обробки результатів експериментів у галузі протеоміки* широко застосовуються методи аналізу зображень), а й відбувається поширення біоінформаційних підходів на суміжні області, наприклад, популяційну та медичну генетику. Істотно при цьому, що роль біоінформатики не зводиться до обслуговування експериментаторів, як це було кілька років тому: у неї з'явилися власні завдання. Більш докладно звідси можна прочитати у огляді (М. З. Гельфанд, А. А. Миронов. Обчислювальна біологія межі десятиліть. Молекулярна біологія. 1999, т. 33, № 6, з. 969-984); можна згадати також збірник статей (Математичні методи для аналізу послідовностей ДНК. М. С. Уотермен, ред. – М.: Світ, 1999). Проект курсу з біоінформатики, який перераховує основні напрямки. Основні журнали з біоінформатики - "Bioinformatics", "Journal of Computational Biology" та "Briefings in Bioinformatics", конференції - ISMB (Intellectual Systems for Molecular Biology) та RECOMB (International Conference on Computational Biology).

1 (назад до тексту) - Питання про те, що таке повністю секвенований геном багатоклітинного організму, нетривіальне. Зокрема, значну його частину (кілька відсотків) становлять повтори, які взагалі дуже складні для секвенування. У таких областях є мало генів, і тому їх зазвичай залишають «на потім». Поточний стан геному людини нагадує розсипану мозаїку, частина елементів якої відсутня, а крім того, підмішані фрагменти інших мозаїк (сторонні послідовності).
2 (назад до тексту) – У плані одного академічного інституту на 2001 рік у розділі «біоінформатика» можна було зустріти, наприклад, комп'ютерне моделювання скорочень серцевого м'яза – це дуже цікава та шанована, але цілком окрема тема. А в університетському курсі біоінформатики пропонується вивчати "Можливий механізм пунктурної терапії".
(назад до тексту) - Див. дуже повчальну замітку Клода Шеннона "The Bandwagon" (Trans. IRE, 1956, ІТ-2 (1), 3, російський переклад: К. Шеннон. Роботи з теорії інформації та кібернетиці. - М: Вид-во іноземної літератури, 1963). Ось цитата: «Зараз теорія інформації, як модний п'яний напій, крутить голову всім навколо. Для всіх, хто працює в галузі теорії інформації, така популярність безсумнівно приємна і стимулює їхню роботу, але в той же час і насторожує. магічних слів, таких як інформація ,ентропія ,надмірність... не можна вирішити всіх невирішених проблем ... На поняття теорії інформації дуже великий, навіть, можливо, занадто великий попит. Тому ми зараз маємо звернути особливу увагу на те, щоб дослідницька робота в нашій області велася на найвищому науковому рівні, який лише можна забезпечити».

ДНК (дезоксирибонуклеїнова кислота) - полімерна молекула, елементарними одиницями якої є чотири нуклеотиду: A, C, G, T. Ген- Ділянка ДНК, що кодує один білок. Білок- полімер, у побудові якого беруть участь 20 амінокислот(Насправді більше, але інші амінокислоти з'являються внаслідок додаткової хімічної модифікації). Білки грають основну роль життя клітини - формують її скелет, каталізують хімічні реакції, виконують регуляторні і транспортні функції. У живій клітині кожна молекула білка має складну просторову структуру (див. рис. 1).

Секвенування- Визначення послідовності нуклеотидів у фрагменті ДНК. Саме це мають на увазі, коли в газетах пишуть про «розшифрування геному людини». Дослідження роботи генів у масштабі цілих організмів, а також еволюція геномів становлять предмет геноміки, а аналіз повного набору білків у клітині та його взаємодій друг з одним - предмет протеоміки 2 .

Інфузорне програмування

У другій декаді вересня у Празі відбулася 6-та «Європейська конференція зі штучного життя» - міждисциплінарний форум, на який збираються вчені, які вивчають природу та переймають у своїх дослідженнях її «творчий досвід».

ННаприклад, дослідники з голландського «Центру природних обчислень» при Лейденському університеті вважають, що, освоївши деякі прийоми генетичних маніпуляцій, запозичені у найпростіших одноклітинних організмів - війкових інфузорій, людство зможе скористатися гігантським обчислювальним потенціалом, прихованим.

Вії мешкають на Землі, щонайменше, два мільярди років, їх виявляють практично всюди, навіть у найнесприятливіших місцях. Директор Центру Гжегож Розенберг (Grzegorz Rozenberg) називає ці інфузорії «одним із найуспішніших організмів на Землі». Вчені пояснюють таку «удачливість» надзвичайно ефективними механізмами маніпуляції власної ДНК, що дозволяють інфузоріям пристосовуватися практично до будь-якого середовища проживання.

Унікальність війкових у тому, що їхня клітина має два ядра – одне велике, «на кожен день», де в окремих нитках зберігаються копії індивідуальних генів; і одне маленьке, що зберігає в клубку використовується при репродукції єдину довгу нитку ДНК з усіма генами одночасно. У ході розмноження "мікроядро" використовується для побудови "макроядра" нового організму. У цьому ключовому процесі і відбуваються надзвичайно цікаві для вчених «нарізання» ДНК мікроядра на короткі сегменти та їх перетасовування, що гарантують те, що в макроядрі неодмінно виявляться нитки з копіями всіх генів.

Розенбергом і його колегами встановлено, що спосіб, за допомогою якого створюються ці фрагменти, нагадує техніку «зв'язкових списків», що здавна застосовується в програмуванні для пошуку і фіксації зв'язків між масивами інформації. Більш глибоке вивчення репродуктивної стратегії війкових інфузорій при сортуванні ДНК відкриває нові та цікаві методи «зациклювання», згортання, виключення та інвертування послідовностей.

Нагадаємо, що в 1994 році Леонардом Едлманом (Leonard Adleman) експериментально було продемонстровано, як за допомогою молекул ДНК в єдиній пробірці можна швидко вирішувати класичну комбінаторну «завдання про комівояжера» (обхід вершин графа за найкоротшим маршрутом), «незручну» для комп'ютерів традиційної архітектури. . Результати ж експериментів вчених із лейденського центру дають підстави сподіватися, що в недалекому майбутньому війкові інфузорії можна буде використовувати для реальних обчислень ДНК.

А ось англійські дослідники з компанії British Telecom дійшли висновку, що вивчення поведінки колоній бактерій дає ключ до вирішення найскладнішого завдання впорядкування комунікаційних мереж.

Для опису найближчого майбутнього комп'ютерів сьогодні все частіше залучають популярну концепцію «всепроникних обчислень» - ідею про гігантську сукупність мікрокомп'ютерів, вбудованих в усі предмети побуту, які непомітно взаємодіють один з одним. У цій єдиній бездротовій мережі буде пов'язано все: кухонна техніка, побутова електроніка, сенсори в кімнатах, радіомаяки на дітях і домашніх тварин, що стежать за мікрокліматом... Список цей можна збільшувати нескінченно. Але зараз додавання кожної нової «розумної штучки» забирає багато часу, щоб взаємно підлаштувати роботу цього пристрою і конфігурації, що вже сформувалася. У концепції ж майбутнього, оскільки господарі будинку, за визначенням, не мають ні часу, ні знання для налаштування спільної роботи всієї цієї армії незліченних «розумних речей», спочатку передбачається здатність системи до самоорганізації. Тому достатньо природно, що погляд вчених спрямував до природи, де подібні завдання вирішені давно та успішно. Зокрема, експерименти дослідників British Telecom показали, що їхня система, що імітує поведінку колонії бактерій у строматолітах 1 , здатна підтримувати роботу мережі з кількох тисяч пристроїв, автоматично керуючи великими популяціями окремих елементів.

Для симуляції функціонування такої колонії британськими вченими було створено мережу із трьох тис. вузлів. Основою самоорганізації стало присвоєння різних пріоритетів пакетам даних, що розсилаються по мережі. Наприклад, вищий пріоритет отримали «інформаційні» пакети, що доносять послання від одного вузла до іншого (крім них у системі розсилаються ще «керуючі», «конфігуруючі» та інші пакети), тому ними займаються пристрої, які мають на даний момент найкращі зв'язки з максимальним числом елементів мережі.

У British Telecom вважають, що втілення експериментальної концепції в реальних продуктах очікується вже через п'ять-шість років.

Ще одна цікава технологія була представлена ​​на конференції бельгійськими дослідниками під керівництвом професора Марко Доріго (Marco Dorigo). Вони продемонстрували, що програми, що імітують стратегію поведінки мурашиної спільноти, можуть успішно керувати роботою складних комп'ютерних мереж.

Ризикуючи у пошуках корму, мурахи-розвідники залишають за собою мічену феромонами доріжку. При цьому найчастіше до одного джерела їжі прокладається відразу кілька стежок, але розвідник, який відкрив найкоротшу стежку, повертається швидше і забирає за собою одноплемінників. Виділені ними феромони роблять стежку пахучішою, ніж інші - в результаті найвигідніша стежка швидко стає найпопулярнішою. Вчені взяли цю тактику на озброєння: створені ними програмні агенти випадково «дзвонять» канали зв'язку між різними вузлами мережі і мітять «стежки» цифровими «феромонами», на підставі чого визначають оптимальний маршрут передачі пакетів даних з однієї точки в іншу.

Практичні випробування проводились у мережах Національного наукового фонду США та японської корпорації NTT. Синтетичні «мурахи» мали, нічого не знаючи про конфігурацію мережі, знайти найкоротшу дорогу від одного вузла до іншого. Швидко дослідивши мережу, агенти визначили її будову і невдовзі вже могли «підказати» будь-якому інформаційному пакету якого наступного вузлу йому треба попрямувати, щоб досягти своєї мети швидше. Інакше висловлюючись, було реалізовано механізм високоякісного інтелектуального роутингу, причому у разі виникнення різних «заторів» у мережі «штучні мурахи» реконфігурували схему роутинга швидше, ніж традиційні рішення.

Біоалгоритміка

Ця замітка присвячена розділу біоінформатики, який можна назвати «біоалгоритмікою» - алгоритмам аналізу первинних структур (послідовностей) біополімерів. Біоалгоритміка знаходиться на стику прикладної теорії алгоритмів та теоретичної молекулярної біології і, подібно до інших розділів біоінформатики, бурхливо розвивалася протягом 70-х - 90-х років XX століття 1 .

Аалгоритми аналізу символьних послідовностей та пов'язані з ними алгоритми сортування та алгоритми на графах активно вивчалися та розроблялися, починаючи з другої половини 50-х років. Алгоритмічний бум 60-х - 70-х був пов'язаний як з розробкою теоретичних моделей обчислень (кінцеві автомати та їх варіанти з різними видами пам'яті), так і з появою комп'ютерів і, отже, реальною потребою в обробці значних (на той час) обсягів даних. Своєрідними підсумками цього періоду стали багатотомне «Мистецтво програмування» Д. Кнута (1968-1973) та «Побудова та аналіз обчислювальних алгоритмів» А. Ахо, Дж. Хопкрофта та Дж. Ульмана (1976). Аналіз досягнень цього чудового етапу у розвитку теорії алгоритмів є також у книзі: У. А. Успенський, А. Л. Семенов. Теорія алгоритмів: основні відкриття та програми. - М: Наука, 1987.

Отже, на момент створення перших баз даних послідовностей ДНК і білків - початку 80-х - алгоритмічний апарат був, значною мірою, готовий. При цьому фахівці в галузі алгоритмів розглядали біологічні додатки в одному ряду з технічними, одні й самі алгоритми застосовувалися, наприклад, для порівняння («вирівнювання») біологічних послідовностей і для пошуку збоїв при зберіганні файлів. Характерна назва першого збірника робіт з біоалгоритміки - "Time Warps, String Edits, and Macromolecules: The Theory and Practice of Sequence Comparison" (Sankoff, D and Kruskal, JB, eds, 1983).

Втім, незабаром з'ясувалося, що аналіз біологічних послідовностей має власну специфіку - передусім з погляду постановок завдань. Ось, наприклад, завдання розпізнавання «вторинної» структури РНК. Вона дуже важлива для молекулярної біології та вперше була розглянута ще наприкінці 70-х років. Молекула рибонуклеїнової кислоти (РНК) – однонитковий полімер, що складається з чотирьох видів мономерів-нуклеотидів (аденін, гуанін, урацил, цитозин). А-У і, відповідно, Г-Ц можуть утворювати водневі зв'язки, що стабілізують молекулу. Однак утворення одних зв'язків через стереохімічні міркування унеможливлює утворення інших, тобто не всі комбінації міжнуклеотидних зв'язків у молекулі РНК допустимі (правила конфліктів між зв'язками відомі). Потрібно для даної нуклеотидної послідовності знайти найбільш стабільну вторинну структуру, тобто допустимий набір міжнуклеотидних зв'язків, що містить найбільшу можливу кількість елементів (рис. 1). Це завдання може бути переформульовано як завдання побудови графа (точніше - гіперграфа, див. нижче) спеціального виду з максимально можливою сумою ваг ребер (вершини відповідають нуклеотидам, ребра - встановленим зв'язкам) і вирішена за допомогою методу динамічного програмування (Ruth Nussinov та співавт., 1978; також див. гл. 7 у книзі М. Уотермена ). Однак обмеження, що з'являються на вигляд графа, дуже екзотичні з точки зору небіологічних додатків. Інший приклад завдання, що не має сенсу поза біологічним контекстом, - розпізнавання фрагментів ДНК, що кодують, розглянуте в статті Михайла Гельфанда.

Повертаючись до завдання розпізнавання найбільш стабільної «вторинної» структури РНК, зауважимо такі обставини, характерні для багатьох важливих завдань біоалгоритміки:

Модель, покладена основою описаної вище завдання, - спрощена й у часто не узгоджується з експериментом. Корисно враховувати і внесок нуклеотидів, які беруть участь у освіті водневих зв'язків. Обмеження на безліч допустимих наборів зв'язків, прийняті в завданні (а), є дуже суворими. Різні формальні постановки завдань, що краще відображають біологічну реальність, призводять до суттєвого ускладнення алгоритму;

Насправді молекула РНК може приймати не ту структуру, якій ми приписали оптимальну енергію, а дещо іншу, наприклад, через те, що ми не знаємо точних значень енергетичних параметрів. Тому корисно не шукати одну «оптимальну» структуру, а проаналізувати всі можливі структури та оцінити ймовірність утворення кожного окремого зв'язку («статистична вага» зв'язку). Це також можна вирішити шляхом динамічного програмування.

Багато авторів намагаються з'ясувати вторинну структуру РНК, не зводячи її до будь-якої алгоритмічної оптимізаційної задачі, а шляхом моделювання реального процесу «згортання» молекули РНК (тобто встановлення та зникнення водневих зв'язків).

Специфіка біоалгоритміки, проте, проявляється у завданнях, які «за визначенням» було неможливо зустрітися поза аналізу біологічних послідовностей. Показовою є найстаріша і, напевно, найпопулярніша задача аналізу біологічних послідовностей - їх вирівнювання. Вирівняти дві послідовності - це зобразити їх один над одним, вставляючи обидві прогалини так, щоб зробити їх довжини рівними.Ось, наприклад, як можна вирівняти слова ПІДБЕРЕЗОВИК і ПОДОСИНОВИК (див. врізання).

Такий спосіб зображення послідовностей широко поширений молекулярної біології. Передбачається, що вирівнювання відображає еволюційну історію, тобто символи, що стоять один під одним, відповідають одному й тому ж символу послідовності-предка. На жаль, ми не знаємо, як саме точилася еволюція послідовностей. Тому як «правильний» зазвичай вибирається вирівнювання, оптимальне щодо деякої функції якості. Але як ми можемо контролювати правильність вибору цієї функції? Чи є у нас (нехай приблизні) «еталони»? На щастя, так. Як еталонні можна взяти вирівнювання, що відповідають найкращому можливому поєднанню їх просторових структур (такі структури відомі для кількох сотень білків). Це пов'язано з тим, що функціонування білка в клітині визначається насамперед його просторовою структурою і очікується, що амінокислоти, що лежать у подібних місцях тривимірної структури, відповідають тим самим амінокислотам предкового білка.

У «добіологічному» аналізі послідовностей (наприклад, порівняння файлів) використовувалося поняття редагуючої відстані. При цьому фіксується набір операцій, що редагують (наприклад, заміна символу, вставка символу та видалення символу) і для кожної операції фіксується ціна. Тоді кожне вирівнювання отримує свою ціну, що визначається як сума цін окремих операцій.

Найкращим вважається те, що має найменшу ціну. Наприклад, при ціні заміни 1 і ціні вставки/видалення 3, кращими в прикладі у врізанні 2 будуть третє і четверте вирівнювання, а при ціні заміни 10 і тій самій ціні вставки/видалення, кращим буде п'яте.

Досить швидко з'ясувалося, що з вирівнювання біологічних послідовностей у цю природну схему необхідно внести низку важливих змін. Річ у тім, різні амінокислоти різні по-різному. Наприклад, аланін і валін дуже схожі за своїми властивостями (і ціна заміни аланіну на валін має бути невеликою), і вони обидва абсолютно не схожі на триптофан. Більше того, навіть однакові амінокислоти «однакові по-різному». Так, триптофан - рідкісний, і зіставлення двох триптофанів цінніше, ніж зіставлення дуже поширених аланінів.

Тому замість «ціни заміни символу» у схемі відстані, що редагує, при порівнянні білків використовується вагова матриця замін, де кожній парі символів відповідає вага (позитивна - для схожих, негативна для несхожих), а вирівнюванню в цілому - вага W=R-G, де R - сумарна вага зіставлень символів (відповідно до обраної вагової матриці замін), G - сумарний штраф за видалення та вставки символів. Таким чином, оптимальне вирівнювання – це вирівнювання, що має найбільшийвага (у той час як ціна була потрібна найменша). Наприклад, нехай вага збігу для голосних літер +2, вага збігу для приголосних літер +1, вага зіставлення двох різних голосних або двох різних приголосних -1, вага зіставлення голосної та приголосної -2. Далі нехай штраф за видалення або вставку символу -5. Тоді, наприклад, третє вирівнювання має вагу -3 а четверте - +1. Таким чином, оптимальне вирівнювання слів ПІДБЕРЕЗОВИК та ПОДОСИНОВИК (при обраних матриці замін та штрафі за видалення/вставку) - четверте. Перехід від мінімізаціїціни до максимізаціїякості - це не тільки технічний трюк. Мовою максимізації якості природно ставиться завдання про пошук оптимального локальногоподібності. Це завдання відповідає порівнянню двох білків, які під час еволюції стали зовсім несхожі - скрізь, крім щодо короткої ділянки.

Алгоритм побудови оптимального вирівнювання заснований на методі динамічного програмування, введеному в широку практику Річардом Беллманом в 1957 році. Ідея методу полягає в наступному: щоб вирішити основне завдання, потрібно придумати безліч проміжних і послідовно їх вирішити (у якому порядку - окреме питання). При цьому чергове проміжне завдання має «легко» вирішуватись, виходячи з уже відомих рішень раніше розглянутих завдань. Безліч проміжних завдань зручно представляти як орієнтованого ациклічного графа. Його вершини відповідають проміжним завданням, а ребра вказують на те, що результати рішень яких проміжних завдань використовуються для основної. Таким чином, вихідне завдання зводиться до пошуку оптимального шляху в графі 2 (докладніше про метод динамічного програмування див. книгу Ахо, Хопкрофта і Ульмана, а також статтю Finkelstein A.V., Roytberg M.A. 30 (1-3): 1-19.). Аналогічно можна переформулювати різні варіанти завдань вирівнювання, передбачення вторинної структури РНК та білків, пошуку білок-кодуючих областей ДНК та інших важливих проблем біоінформатики.

При побудові оптимального вирівнювання (ми розглядаємо найпростіший випадок, коли видалення та вставка окремих символів штрафуються незалежно) проміжні завдання - це побудова оптимальних вирівнювань початкових фрагментів вихідних послідовностей. У цьому завдання треба розв'язувати порядку зростання довжин фрагментів. Граф залежності між проміжними рішеннями для порівняння слів «ПАПКА» ​​та «ПАПАХА», а також послідовність проміжних кроків, що призводять до оптимального вирівнювання, показано на рис. 2.

Рис. 2.

(a) Граф залежностей між проміжними завданнями для вирівнювання слів ПАПКА та ПАПАХА. Кожна вершина відповідає парі початкових фрагментів вказаних слів. Діагональне ребро, що входить у вершину, відповідає зіставленню останніх літер порівнюваних початкових фрагментів (випадок 1), горизонтальне ребро - видалення літери в слові ПАПАХА, вертикальне ребро - видалення літери в слові ТАПКА (випадки 2 і 3). Права верхня вершина - початкова та відповідає вирівнюванню порожніх слів, ліва нижня вершина - кінцева, відповідає вирівнюванню повних слів ТАПКА та ПАПАХА.
(b) Оптимальне вирівнювання слів ПАПКА і ПАПАХА при таких параметрах: вага збігу літер: 1, штраф за заміну гласної на гласну або згодну на згодну: 1, штраф за заміну гласної на згодну або згодну на гласну: 2, штраф за видалення символу: 3.
(c) Траєкторія, що відповідає оптимальному вирівнюванню. У клітинах зазначені ваги проміжних оптимальних вирівнювань. Наприклад, вага оптимального вирівнювання для "ПАП" і "ПАПА" дорівнює 0, а для "ПАПК" і "ПАПАХ" дорівнює -1.

На двох прикладах - розпізнавання вторинної структури РНК (швидко) і вирівнювання білкових послідовностей (детальніше) ми простежили за еволюцією постановок завдань у біоалгоритміці. Згадаємо коротко ще кілька аспектів. Мабуть, з практичної точки зору найважливішим є пошук у базах даних послідовностей, подібних до досліджуваної. Визначальну роль починають грати проблеми обчислювальної ефективності, які вирішуються, зокрема, із застосуванням алгоритмів хешування. Для передбачення просторової структури білків важливими є алгоритми вирівнювання послідовності зі структурою (при цьому використовується той факт, що через різницю фізико-хімічних властивостей амінокислоти зустрічаються з різною частотою на поверхні білка та в структурному ядрі). Нарешті, ми повністю залишили осторонь завдання побудови еволюційних дерев за білковими послідовностями. Підкреслимо, що у всіх випадках відбувається інтенсивне «притирання» постановок завдань - як з біологічної (велика адекватність), так і з алгоритмічної (можливість побудови ефективніших алгоритмів) точки зору.

Живі організми влаштовані дуже складно і містять велику кількість взаємодіючих систем. Основну роль в управлінні життєдіяльністю відіграють гени - ділянки молекули ДНК, в яких зберігається інформація про влаштування молекул, залучених до різних процесів у живій клітині. Вважається, що ген працює, коли з нього зчитується інформація.

Біологам і медикам необхідно знати реакцію великих каскадів взаємозалежних і взаємозумовлюючих генів на ту чи іншу зміну зовнішніх умов, наприклад, у відповідь на введені ліки.

Повна кількість генів вимірюється величинами порядку 103 (6200 у дріжджів) - 104 (38 000 за останніми даними в людини), причому базові життєві процеси регулюються сотнями генів. До останнього часу значною мірою були відсутні можливості для отримання, зберігання та обробки таких значних масивів даних. Завдяки прогресу комп'ютерної індустрії були створені як технології для одночасного експериментального отримання інформації про роботу великої кількості генів у клітині, так і методи обробки цієї інформації, що дозволяють зробити на її основі прості та однозначні висновки (наприклад, поставити точний діагноз будь-якого захворювання).

Виникла індустріальна молекулярна біологія, в якій застосування комп'ютерних технологій є необхідною умовою та передбачається вже на стадії планування експерименту. Формування цієї галузі зовсім змінило погляд на роль обчислювальних пристроїв у біологічній науці - те, що раніше було додатковим, необов'язковим та допоміжним фактором, несподівано почало грати визначальну роль. Таким чином, виявилось, що прогрес біотехнології нереальний без розробки спеціалізованих апаратних, алгоритмічних та програмних засобів, а відповідна галузь кібернетики увійшла до складу біоінформатики.

Сучасна експериментальна техніка дозволяє створити аналізуючу матрицю (названу також біочипом) розміром кілька сантиметрів, з допомогою якої можна отримати дані про стан всіх генів організму. Для створення ефективної методики необхідні спільні зусилля фахівців у галузі молекулярної біології, фізики, хімії, мікроелектроніки, програмування та математики.

Історія розвитку технології биочипов належить початку дев'яностих років, у своїй російська наука зіграла не останню роль. Тут доречно пояснити, що біочіпи за природою нанесеного на підкладку матеріалу діляться на «Олігонуклеотидні» (див. «КТ» № 370, Рубен Єніколопов, «Біочипи»), коли наносяться короткі фрагменти ДНК, зазвичай належать до одного і того ж гену, і біочіпи на основі кДНК, коли робот наносить довгі фрагменти генів (довжиною до 1000 Нуклеотидів).

Найбільш популярні в даний час біочіпи на основі кДНК, що стали по-справжньому революційною технологією біомедицини. Зупинимося докладніше на їхньому приготуванні, а також на отриманні та обробці даних за їх допомогою. Визначальною технологічною ідеєю стало застосування скляної підкладки для нанесення генетичного матеріалу, що уможливило поміщати на неї мізерно малі його кількості і дуже точно визначати місце розташування конкретного виду ДНК, що тестується. Для приготування биочипов стали використовуватися роботи, що застосовуються насамперед у мікроелектроніці до створення мікросхем (рис. 1). Молекули ДНК кожного типу створюються у достатній кількості копій за допомогою процесу, що називається ампліфікацією; цей процес також може бути автоматизований, навіщо використовується спеціальний робот - помножувач. Після цього отриманий генетичний матеріал наноситься в задану точку на склі (на жаргоні такий процес називається «друк») і хімічно пришивається до скла (іммобілізація). Для іммобілізації генетичного матеріалу необхідна первинна обробка скла, а також обробка надрукованого биочипа ультрафіолетом, що стимулює утворення хімічних зв'язків між склом та молекулами ДНК (рис. 2).

Грубо кажучи, із клітини виділяється суміш продуктів роботи генів, т. е. РНК різних типів, вироблених певних умов. Результатом експерименту і є знання того, продукти яких саме генів з'являються в клітині в умовах, що цікавлять дослідника. Молекули кожного типу РНК зв'язуються (у кращому разі) з єдиним типом молекул з іммобілізованих на біочипі. Ті молекули, які не зв'язалися, можна змити, а для визначення того, до яких із іммобілізованих на чіпі молекул знайшлися «партнери» у досліджуваній клітині, експериментальна та контрольна РНК мітиться флуоресцентними барвниками.

Таким чином, наступним етапом в отриманні результату на приготовленому біочіпі є біохімічна реакція, в процесі якої один або кілька зразків ДНК або РНК, отримані з клітин, тканини або органу, декількома флуоресцентними барвниками та гібридизуються (зв'язуються) з матеріалом, надрукованим на біочипі.

Після того, як флуоресцентні зразки прореагували з биочипом, чіп сканують лазером, висвітлюючи по черзі точки нанесення ДНК кожного конкретного типу і стежачи за інтенсивністю флуоресценції сигналу (рис. 3).

Виготовлення одного биочипа займає від трьох до шести тижнів за умови, що у розпорядженні дослідника є генетичний матеріал для нанесення на чіп. Сам експеримент - гібридизація та зняття даних - займає один-два дні, а за традиційної технології така ж група дослідників витратила б роки на послідовне проведення всіх експериментів, включених в один биочип.

Сигнали лазерного сканування мають бути оброблені та проаналізовані. Гени на склі дають сигнали різної інтенсивності, крім того, завжди є деяке фонове випромінювання від мітки, яка не змилася зі скла, яке також неоднорідне. Необхідно автоматично виділити з шуму сигнали різної інтенсивності, що несуть різну інформацію.

На наступному етапі гени, які дають за однакових умов однаковий сигнал, об'єднуються в групи. Це також робиться автоматично за допомогою алгоритмів кластерного аналізу. Кластери генів, що ведуть себе подібним чином в різних умовах або в різні моменти часу, є вихідною точкою для висновків біологічного характеру.

У Радянському Союзі була створена чудова школа з розробки алгоритмів розпізнавання зображень, насамперед для аналізу зображень, що надходять із штучних супутників Землі. Наша математична освіта протягом багатьох десятиліть була однією з найкращих у світі, тому наші прикладники, інженери та алгоритмісти завжди легко розробляли оригінальні спеціалізовані методи аналізу даних. Не дивно, що вихідці з нашої Батьківщини працюють у багатьох фірмах, що працюють на передньому краї індустрії, що виникає на наших очах. Наші колишні співвітчизники є організаторами однієї з найвідоміших фірм, що надають методи обробки, - Informax, акції якої є ціноутворюючими у всіх біотехнологічних біржових індексах

Проте створення біохімічної технології, переважно, - заслуга американських фірм та наукових центрів. Багато фірм роблять на замовлення самі біочіпи. Найвідоміші з них – це Affymetrix та Clontech . Incyte -найпотужніша на сьогоднішній день компанія - крім виготовлення биочипа на замовлення та продажу генетичного матеріалу для друку на чіп, сама виконує і гібридизацію, а замовнику надає лише готові дані. Розвиток індустрії зайшов настільки далеко, що виник прибутковий ринок приготування спеціально обробленого скла для приготування біочипів в умовах окремої молекулярно-біологічної лабораторії. До таких фірм відноситься, наприклад, Corning .

Які ж завдання під силу подібної непростої технології, що має справу із сотнями тисяч генів одночасно? Відразу хотілося б зробити застереження, що сьогодні є тенденція переходу від чіпів з тисячами генів до чіпів з сотнями генів, відібраних спеціально для вирішення конкретного завдання. Пояснимо на прикладі. Дослідниками Массачусетського технологічного інституту було зроблено роботу з використання чіпів для діагностики різних підкласів гострого лейкозу людини. Точна діагностика двох підтипів гострого лейкозу (гострий мієлоїдний та гострий лімфобластний) має визначальне значення при виборі курсу терапії. Спочатку був використаний олігонуклеотидний чіп із 6000 генів. Використовуючи як пробу РНК з клітин кісткового мозку, дослідникам вдалося виділити і підготувати до реального використання як підчіп набір з 50 генів, сильна відмінність експресії яких дозволяє однозначно визначити тип пухлини 1 (рис. 4). Ми вважаємо, що немає потреби доводити необхідність діагностичних чіпів, тому враховуючи невелику кількість аналітичних осередків на чіпі, а отже, меншу собівартість, існує реальна можливість їх розробки та виробництва у нас у країні.

Щодо класичної науки, то тут можливості застосування чіпів безмежні. Група дослідників з Іллінойського університету під керівництвом Андрія Гудкова, використовуючи кДНК-чіпи, знайшла та порівняла спектри генів, які відповідають за реакцію клітини на радіаційні впливи різної природи. Під впливом радіації, яке клітина сприймає як стрес, активуються гени, відомі як каскад залежних від р53 генів (р53 – білок, одна з головних функцій якого – захищати клітину від будь-яких несприятливих впливів). Багато з цих білків можуть розглядатися як кандидати на використання в хіміотерапії ракових пухлин та для захисту нормальних клітин організму від протипухлинних агентів, таких як радіаційне опромінення та хіміотерапевтичні препарати.

Цікаву за практичним додатком роботу зробили вчені з лабораторії радіобіології у Гельсінкі. Використовуючи чіпи, вони спробували з'ясувати, які гени змінюють свою активність під впливом радіосигналу з частотою 900 МГц, який дають усіма улюблені стільникові телефони. Людські клітини з первинного підшкірного шару були витримані в культурі під цим сигналом протягом однієї години, після чого РНК з цих клітин і клітин контрольної серії була пущена в якості проби на чіп. Гени, активність яких істотно змінилася протягом цього експерименту, відносяться до генів стрес-відповіді, таких як р53, hsp27, зміна активності яких у багатьох випадках говорить про те, що клітина або цілий організм піддаються несприятливим впливам. Мабуть, можна говорити (хоч і дуже обережно) про те, що отримані прямі докази стресогенного впливу електромагнітного поля, а також дані про біохімічні основи його біологічної дії. Так що не виключено, що люди, які менше розмовляють протягом дня стільниковим телефоном або використовують спеціальні навушники, менше втомлюються наприкінці робочого дня.

Зважаючи на все, ми присутні при виникненні нового методу отримання та використання інформації про живу природу. Дані збиратимуться автоматично та на промисловій основі. Планування та підготовка таких експериментів, ймовірно, згодом також здійснюватиметься автоматично. На користь цього свідчить досвід розвитку комп'ютерних технологій, де створення мікропроцесора автоматизовано значною мірою вже на ранніх стадіях проектування, все ж таки подальші стадії розробки та впровадження у виробництво все більшою мірою відбуваються практично без участі, та й без контролю людини. На «вході» буде ставитися завдання вкрай загального вигляду, наприклад: знайти три характерні гени, які відповідають за реакцію клітини на такі нестандартні зовнішні умови, і не працюють у жодних нормальних умовах. Автоматична система сама здійснюватиме підбір біологічного матеріалу, підготовку, постановку та інтерпретацію біологічного експерименту, а також формулювання найбільш ймовірного вирішення поставленого завдання. На долю дослідника залишиться лише тестування отриманих результатів та вироблення інструкцій для застосування здобутого нового знання в медицині чи біотехнології.

Понад те, зміниться, мабуть, сама ідея біологічного експерименту. Оскільки висновок про роботу тієї чи іншої живої системи виноситиметься за допомогою комп'ютерного аналізу даних, біологічний експеримент часто ставиться не з метою безпосередньої перевірки тієї чи іншої ідеї, як зараз, але з метою розшивки «вузьких місць» у роботі автоматизованої системи зберігання та обробки інформації. Щось подібне ми вже спостерігаємо у фізиці високих енергій, де експерименти на прискорювачах ставляться з урахуванням існуючих наближених методів обчислень у фізичних теоріях, з метою більш точного визначення оціночних параметрів, що найбільше впливають на точність фізичних величин, що обчислюються.

Хотілося б сподіватися, що в російських умовах можна буде включитися у серйозну роботу щодо створення програмного забезпечення індустріальної біомедицини. Робота в цій галузі не вимагає великих витрат, характерних для біологічних досліджень (на обладнання, реактиви і т. д.). Необхідні винахідливість, завзятість та фантазія, а також гарне володіння сучасними математичними методами статистичного аналізу, що завжди становило наші сильні сторони.

Очевидно, єдиною організацією у Росії, що серйозно займається технологією биочипов, є Інститут молекулярної біології РАН ім. В. А. Енгельгардта. У цьому інституті створюються також мікрочіпи з осередками, що містять різні зонди для проведення хімічних та ферментативних реакцій з аналізованими зразками (див. «Інфобізнес», №151 - Л. Л.-М.).

Розробка технології біологічних мікрочіпів розпочато в ІМБ РАН у 1989 році і з того часу продовжується посиленими темпами, останніми роками у співпраці зі США. ІМБ РАН належить 15 міжнародних та безліч російських патентів. Докладніше з дослідженнями, що проводяться в ІМБ РАН, можна ознайомитись на сайті http://www.biochip.ru/ .

Природний інтерес низки дослідницьких груп (серед них Оксфордський та Техаський університети, Массачусетський технологічний інститут, лабораторії Берклі, Санді та Рокфеллера) викликали природні способи зберігання та обробки інформації в біологічних системах. Підсумком їх досліджень з'явився гібрид інформаційних і молекулярних технологій, а також досягнень біохімії - біологічний комп'ютер.

Йдуть розробки кількох типів біокомп'ютерів, що базуються на різних біологічних процесах. Це насамперед перебувають у стадії розробки ДНК-комп'ютери та клітинні біокомп'ютери.

ДНК-комп'ютери. У живих клітинах генетична інформація закодована у молекулі ДНК (дезоксирибонуклеїнової кислоти). ДНК - це полімер, що складається з субодиниць, званих нуклеотидами. Нуклеотид являє собою комбінацію цукру (дезоксирибози), фосфату і одного з чотирьох азотистих підстав, що входять до складу ДНК: аденіну (А), тиміну (Т), гуаніну (G) і цитозину (C). Молекула ДНК утворює спіраль, що складається із двох ланцюгів, об'єднаних водневими зв'язками. При цьому основа одного ланцюга може з'єднуватися водневими зв'язками тільки з основою Т іншого ланцюга, а основа G - тільки з основою С. Маючи один з ланцюгів ДНК, завжди можна відновити будову другої.

Завдяки цій фундаментальній властивості ДНК, що отримала назву комплементарності, генетична інформація може точно копіюватися і передаватися від материнських клітин до дочірніх клітин. Реплікація молекули ДНК відбувається за рахунок роботи спеціального ферменту ДНК-полімерази. Цей фермент ковзає вздовж ДНК та синтезує на її основі нову молекулу, в якій усі підстави замінені на відповідні парні. Причому фермент починає працювати, коли до ДНК прикріпився коротенький шматочок - "затравка" (праймер).

У клітинах існує також споріднена з молекулою ДНК молекула матричної рибонуклеїнової кислоти (РНК). Вона синтезується спеціальним ферментом, що використовує як зразок один з ланцюгів ДНК, і комплементарна по відношенню до неї. Саме молекулі РНК, у клітині, як у матриці, з допомогою спеціальних ферментів і допоміжних чинників відбувається синтез білків. Молекула РНК хімічно стійкіша, ніж ДНК, тому експериментаторам з нею працювати зручніше. Послідовність нуклеотидів у ланцюзі ДНК/РНК визначає генетичний код. Одиницею генетичного коду – кодоном – є послідовність із трьох нуклеотидів. Вчені вирішили спробувати, за прикладом природи, використовувати молекули ДНК для зберігання та обробки даних у біологічних комп'ютерах.

Першим з них був Леонард Едлмен з університету Південної Каліфорнії, який зумів вирішити завдання гамільтонового шляху. Суть її в тому, щоб знайти маршрут руху із заданими точками старту та фінішу між кількома містами, у кожному з яких дозволяється побувати лише один раз. «Дорожня мережа» є односпрямованим графом. Це завдання вирішується прямим перебором, проте зі збільшенням кількості міст складність її зростає експоненційно (для ланцюжків ДНК число таких пунктів («міст») дорівнює семи, тобто n = 7). Кожен такий «місто» Едлмен ідентифікував унікальною послідовністю з 20 нуклеотидів.
Тоді шлях між будь-якими двома містами складатиметься з другої половини кодуючої послідовності для точки старту, і першої половини кодуючої послідовності для точки фінішу (молекула ДНК, як і вектор, має напрямок).

Синтезувати такі послідовності сучасна молекулярна апаратура дозволяє дуже швидко. У результаті послідовність ДНК із рішенням становитиме 140 нуклеотидів (7x20). Залишається тільки синтезувати та виділити таку молекулу ДНК. Для цього в пробірку міститься близько 100 трильйонів молекул ДНК, що містять всі можливі 20-нуклеотидні послідовності, що кодують міста та шляхи між ними. Далі за рахунок взаємного тяжіння нуклеотидів А-Т і G-C окремі ланцюжки ДНК зчіплюються один з одним випадковим чином, а спеціальний фермент лігаза зшиває короткі молекули, що утворюються, у більші утворення. При цьому синтезуються молекули ДНК, що відтворюють усі можливі маршрути між містами. Потрібно лише виділити їх ті, що відповідають шуканому рішенню. Едлмен вирішив це завдання біохімічними методами, послідовно вилучивши спочатку ланцюжки, які не починалися з першого міста - точки старту - і не закінчувалися місцем фінішу, потім ті, що містили більше семи міст або не містили хоча б одне. Легко зрозуміти, що будь-яка молекула ДНК, що залишилися після такого відбору, є рішенням завдання.

Слідом за роботою Едлмена пішли й інші. Ллойд Сміт з університету Вісконсін вирішив за допомогою ДНК завдання доставки чотирьох сортів піци за чотирма адресами, яка мала на увазі 16 варіантів відповіді. Вчені з Прінстонського університету вирішили комбінаторне шахове завдання: за допомогою РНК знайшли правильний хід шахового коня на дошці з дев'яти клітин (всього їх 512 варіантів).

Річард Ліптон з Прінстона вперше показав, як, використовуючи ДНК, кодувати двійкові числа та вирішувати логічні вирази. Маючи такий вираз, що включає n змінних, необхідно визначити всі комбінації значень змінних, що роблять вираз істинним. Завдання можна вирішити лише перебором 2n комбінацій. Всі ці комбінації легко закодувати за допомогою ДНК, а далі діяти за методикою Едлмена. Ліптон запропонував навіть спосіб злому шифру DES (американський криптографічний шифр), що трактується як своєрідний логічний вираз.

Першу модель біокомп'ютера у вигляді механізму із пластмаси у 1999 р. створив І. Шапіро з інституту природничих наук Вейсмана.
Модель імітувала роботу молекулярної машини в живій клітині, що збирає білкові молекули за інформацією ДНК, використовуючи РНК
як посередник між ДНК і білком. У 2001 р. Шапіро вдалося реалізувати модель у реальному біокомп'ютері, що складався з молекул ДНК, РНК та спеціальних ферментів. Молекули ферменту виконували роль апаратного, а молекули ДНК програмного забезпечення. В одній пробірці містилося близько трильйона елементарних обчислювальних модулів. В результаті швидкість обчислень досягала мільярда операцій за секунду, а точність – 99,8 %.

Поки біокомп'ютер Шапіро може застосовуватися лише для вирішення найпростіших завдань, видаючи лише два типи відповідей: «істина» чи «брехня». У проведених експериментах за цикл всі молекули ДНК паралельно вирішували єдине завдання. Однак потенційно вони можуть працювати одночасно над різними завданнями, тоді як традиційні ПК є по суті однозадачними.

У 2002 р. фірма Olympus Optical оголосила про створення ДНК-комп'ютера, призначеного для генетичного аналізу. Машину створено у співпраці з біологом Акірою Тояма з Токійського університету. Комп'ютер має молекулярну та електронну складові. Перша здійснює хімічні реакції між молекулами ДНК, забезпечує пошук та виділення результату обчислень. Друга – обробляє інформацію та аналізує отримані результати. Наразі аналіз генів виконується вручну і потребує багато часу: при цьому формуються численні фрагменти ДНК та контролюється перебіг хімічних реакцій. Коли ДНК-комп'ютер буде використовуватися для генетичного аналізу, завдання, які раніше виконувались протягом трьох днів, будуть вирішуватися за шість годин. Технологія генетичного аналізу на основі ДНК-комп'ютера знаходить застосування в медицині та фармацевтиці. Вчені планують впроваджувати молекулярні наноустрою в тіло людини для моніторингу стану її здоров'я та синтезу необхідних їй ліків.

Можливостями біокомп'ютерів зацікавились і військові. Американське агентство з досліджень у галузі оборони DARPA виконує проект під назвою BioComp. Його мета – створення потужних обчислювальних систем з урахуванням ДНК. Принагідно дослідники сподіваються навчитися керувати процесами взаємодії білків та генів. Для цього планується створити потужний симулятор BioSPICE, здатний засобами машинної графіки візуалізувати біомолекулярні процеси.

Клітинні комп'ютери. Ще одним перспективним напрямком біокомп'ютерінгу є створення клітинних комп'ютерів. Для цієї мети ідеально підходять бактерії, якби в їхній геном вдалося включити якусь логічну схему, яка могла б активізуватися в присутності певної речовини. Такі комп'ютери дуже дешеві у виробництві. Їм не потрібна така стерильна атмосфера, як при виробництві напівпровідників. І одного разу запрограмувавши клітину, можна легко і швидко виростити тисячі клітин із такою самою програмою.

У 2001 р. у США були створені трансгенні мікроорганізми (мікроорганізми зі штучно зміненими генами), клітини яких можуть виконувати логічні операції І та АБО. Вчені використовували здатність генів синтезувати той чи інший білок під впливом певної групи хімічних подразників. Генетичний код бактерій Pseudomonas putida був змінений таким чином, що їхні клітини набули здатності виконувати прості логічні операції. Наприклад, при виконанні операції в клітину подаються дві речовини (вхідні операнди), під впливом яких ген виробляє певний білок. Вчені створюють з урахуванням цих клітин складніші логічні елементи, і навіть шукають можливості створення клітини, виконує паралельно кілька логічних операцій.

Елементна основа біологічних комп'ютерів. Для розробки таких комп'ютерів необхідно отримати базові елементи. Пропозицій надходить дуже багато. Так, дослідники ізраїльського інституту «Техніон» створили нанотранзистор, що самозбирається, для розробки якого вони використовували особливості структури ДНК та електронних властивостей вуглецевих нанотрубок. Спочатку частинки молекули ДНК покрили білками бактерії E. Coli», після цього пов'язали з ДНК покриті антитілами нанотрубки, потім у процесі створення пристрою використовували іони золота та срібла. Конструкція, що вийшла в результаті, працює як транзистор.

У 2004 році дослідники розробили мікроскопічні пристрої, які можна впроваджувати у кровообіг. Вони можуть діагностувати онкологічні захворювання та випускати у потрібному місці необхідну дозу ліків. Пристрої побудовані з урахуванням синтетичних ДНК, частина ланцюга служить визначення високої концентрації РНК певного виду, які виробляються раковими клітинами, інша частина молекулярної ланцюга є сховищем і структурою для ще однієї нуклеотидної послідовності ліки. Цей фрагмент ДНК, випущений у потрібному місці, пригнічує активність гена, залученого до розвитку раку. Вчені продемонстрували кілька деталей біологічної молекулярної машини, яка успішно ідентифікувала в пробірці клітини, що відповідають раку простати та раку легень. До повноцінного пристрою, який можна було б застосовувати у боротьбі з раковими захворюваннями, ще далеко, проте вчені зробили важливий крок на шляху створення молекулярних медичних ДНК-роботів.

У тому ж році професор Річард Кіль та його колеги з університету штату Міннесота, США розробили експериментальні біоелектронні схеми. Американські вчені використовували ланцюжки ДНК для створення плоскої тканини, що нагадує застібку-липучку на рівні наноструктур. Досліди, що проводяться, продемонстрували, як штучні фрагменти ДНК самостійно зібралися в заздалегідь розраховану наноструктуру. З регулярним кроком на цій структурі утворилися липучки, здатні прийняти інші складні органічні молекули або різні метали. Автори проекту закріплювали такі молекули на тканині, сформованій ДНК, як радіодеталі на пластмасовій платі.

Нанокомпоненти, зібрані на основі ДНК, теоретично можуть створити схему з характерною відстанню між деталями одну третину нанометра. А оскільки такі компоненти можуть зберігати електричні або магнітні заряди, що випробовується в Міннесоті технологія – це прообраз майбутньої технології створення надшвидких електронних схем з високою щільністю упаковки інформації. Вони будуть поєднувати органічні та неорганічні компоненти.

У 2005 р. Юнсеон Чой з університету штату Мічиган, США, застосував молекули ДНК для побудови наночастинок із заданими властивостями. Використовувалися звані дендримери (крихітні розгалужені полімери), кінці яких можуть містити різні молекули. Спочатку були синтезовані окремі ланки дендрімерів, причому кожна ланка постачалася молекулою ліків та невеликим фрагментом половинки ДНК. При змішуванні всіх цих інгредієнтів ДНК з'єднувалися з додатковими парами основ. Короткі ланки полімеру автоматично зшивались у довгі комплекси. Дендрімери можуть вибірково постачати п'ять окремих ліків п'яти видів клітин. Синтез молекули за методикою Чоя займає 10 кроків замість 25 при використанні колишніх технологій. Недолік технології у тому, що синтез корисних ланцюжків може тривати кілька місяців.

Дослідник Нью-Йоркського університету Нед Сімен створив наномашину, яка виробляє єдиний полімер, що повторює структуру самого пристрою, з розмірами 110×30×2 нм. Апарат складається з ДНК-машин, які працюють на основі певних комбінацій ланцюжків молекул ДНК. У дослідника є впевненість у тому, що йому вдасться створити ДНК-машину, що працює подібно до молекули РНК. Своє застосування майбутня штучна рибосома знайде у синтезі нових матеріалів за заданою послідовністю, закодованою в ДНК. Зрештою, можна навчитися робити полімери та нові матеріали у великих кількостях та за малий проміжок часу завдяки ДНК-машинам, упевнений Сімен.

Білл Дітто з Технологічного інституту штату Джорджія, США, провів експеримент, приєднавши мікродатчики до кількох нейронів п'явки. Він виявив, що в залежності від вхідного сигналу нейрони утворюють нові зв'язки. Звідси можна дійти невтішного висновку, що біологічні комп'ютери, які з нейронно-подобных елементів (нейроэлементов), на відміну кремнієвих пристроїв, зможуть самостійно шукати потрібні рішення, з допомогою самопрограммирования. Дослідник має намір використати результати своєї роботи для створення штучного мозку роботів майбутнього.

В даний час область ДНК обчислень перебуває на етапі підтвердження концепції, коли можливість реального застосування вже доведена. Можна стверджувати, що найближчими десятиліттями технологія продемонструє свої реальні можливості. Зараз відбувається оцінка того, наскільки корисними чи шкідливими є ДНК-комп'ютери для людства. Застосування в обчислювальній техніці біологічних матеріалів дозволить зменшити комп'ютери до розмірів живої клітини. Поки що це виглядає як чашка Петрі, наповнена спіралями ДНК, або як нейрони, взяті у п'явки та приєднані до електричних дротів.

Фактично, наші власні клітини – це нічим іншим, як біологічні машини молекулярного розміру, а прикладом біокомп'ютера служить наш мозок.

Якби модель біологічного комп'ютера Іхуда Шапіро, згадувана раніше, складалася зі справжніх біологічних молекул, його розмір дорівнював би величині однієї з компонентів клітини – 0,000 025 мм. На думку дослідника, сучасні досягнення в галузі складання молекул дозволяють створювати пристрої клітинного розміру, які можна застосовувати для біомоніторингу. Найбільш традиційні ДНК-комп'ютери нині використовуються для розшифрування геному живих істот. Проби ДНК застосовуються визначення характеристик іншого генетичного матеріалу: завдяки правилам спарювання спіралей ДНК, можна визначити можливе розташування чотирьох базових амінокислот (A, C, T і G).

Потенціал біокомп'ютерів дуже великий. Порівняно із звичайними обчислювальними пристроями вони мають низку унікальних особливостей. По-перше, вони використовують не бінарний, а тернарний код (оскільки інформація в них кодується трійками нуклеотидів). По-друге, оскільки обчислення здійснюються шляхом одночасного вступу в реакцію трильйонів молекул ДНК, вони можуть виконувати до 1015 операцій на секунду. Щоправда, отримання результатів обчислень передбачає кілька етапів дуже ретельного біохімічного.
аналізу та здійснюється набагато повільніше. По-третє, обчислювальні пристрої на основі ДНК зберігають дані із щільністю, що в трильйони разів перевищує показники оптичних дисків. І, головне, ДНК-комп'ютери мають винятково низьке енергоспоживання.

Однак при розробці біологічних комп'ютерів багато вчених зіткнулися з цілою низкою серйозних проблем. Перша пов'язана зі зчитуванням результатів обчислень - сучасні способи секвенування (розпізнавання послідовності, що кодує) поки недосконалі: неможливо за один раз розпізнати ланцюжки довжиною більше декількох тисяч підстав - це дуже дорога, складна і трудомістка операція. Друга проблема – помилки у обчисленнях. Для хіміків та біологів точність при синтезі та секвенуванні основ у 1 % вважається дуже хорошою. Але для інформаційних технологій вона неприйнятна: розв'язання задачі можуть загубитися, коли молекули просто прилипають до стінок судин; крім того, немає жодних гарантій, що в ДНК не виникнуть точкові мутації тощо.

Крім того, молекули ДНК з часом можуть розпадатися, і тоді результати обчислень просто зникають на очах! Клітинні комп'ютери, в порівнянні з іншими, працюють досить повільно, і їх легко «збити з пантелику», навмисно чи ненавмисно порушивши обчислювальний процес. З цими проблемами вчені активно борються, але наскільки їм вдасться досягти успіху – покаже найближчим часом. У будь-якому випадку для фахівців – біоінформатиків відкриваються великі перспективи. Однак біокомп'ютери на широкий загал користувачів не розраховані.

У перспективі нанокомп'ютери на основі ДНК зможуть взаємодіяти з клітинами людини, здійснювати спостереження за потенційними хвороботворними змінами та синтезувати ліки для боротьби з ними. За допомогою клітинних комп'ютерів стане можливим поєднання інформаційних технологій із біотехнологіями. Вони зможуть керувати біохімічними процесами, регулювати біологічні реакції всередині людського організму, виробляти гормони та лікарські речовини, а також доставляти до певного хворого органу пацієнта необхідну дозу ліків та ін.



Останні матеріали розділу:

Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає
Основний план дій та способи виживання Вночі тихо, вдень вітер посилюється, а надвечір затихає

5.1. Поняття про місце існування людини. Нормальні та екстремальні умови життєпроживання. Виживання 5.1.1. Поняття про довкілля людини...

Англійські звуки для дітей: читаємо транскрипцію правильно
Англійські звуки для дітей: читаємо транскрипцію правильно

А ви знали, що англійський алфавіт складається з 26 літер та 46 різних звуків? Одна й та сама буква може передавати кілька звуків одночасно.

Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)
Контрольний тест з історії на тему Раннє Середньовіччя (6 клас)

М.: 2019. – 128 с. М.: 2013. – 160 с. Посібник включає тести з історії Середніх віків для поточного та підсумкового контролю та відповідає змісту...