Блоґ одного кібера

Історія хвороби контуженого інформаційним вибухом

Перша людина з відкритим кодом

with 10 comments

Сьогодні (12 лютого 2011 якщо точніше), я опублікував всі мої відомі генетичні дані як open source, і передав їх в громадське надбання. Рівно мільйон моїх генетичних маркерів зараз знаходяться в громадському надбанні. Я вірю, що я один з перших людей в світі, які закоммітили свій генетичний код в децентралізовану систему контролю версій. (Поправка: першим був orta [27 січня]). Найперші реакції які я отримав коли розповідав деяким моїм друзям про те що я збираюсь зробити були комбінацією шоку та скептицизму.

Навіщо робити щось таке?
Ти не боїшся що хтось використає це проти тебе?
Що якщо ним заволодіє твоя медична страхова компанія? Вони б з задоволенням проглянули код, щоб знайти причини відмовити в страховці.
Ух, ніколи не хотів б дізнатись подібні речі про себе!
Що якщо хтось тебе клонує?

Я довго думав над цими та іншими можливими запитаннями, які можна задавати собі перед публікацією персональної інформації такого роду. Це буде мати значні наслідки для вашої приватності. Тим не менш, говорячи тільки за себе, я думаю що вигоди переважають недоліки. Я поясню свої роздуми над кожним з питань в окремому пості.

Але сьогодні, як хочу сфокусувати увагу на результаті роздумів, який змусив мене опублікувати мій генетичний код сьогодні. Тому, давайте розглянемо детальніше що це за дані, і яке ПЗ що його використовує, я сподіваюсь що люди напишуть.

Ваш генетичний код

Існує вебсайт, 23andme, який надає послуги аналізу ДНК. Щоб отримати такий сервіс, потрібно заплатити гонорар, вони присилають вам тюбик для проби, ви плюєте в нього, і відправляєте назад. Вони беруть вашу слину, і поміщають в дещо, що називається genotyping beadchip. В даному конкретному випадку, мою слину помістили на Illumina OmniExpress Plus Genotyping Beadchip. Цей чіп може виявити близько мільйона генетичних маркерів. Ці маркери називаються однонуклеотидними поліморфізмами (англ. single-nucleotide polymorphisms, SNP).

В комбінації, ці SNP можуть багато чого вам розповісти про ваш генетичний характер. Такі речі, як колір очей, волосся, кучерявість, чи збільшений в вас ризик захворювання на діабет, звідки ваші предки, чи навіть чи є в вас опірність до ВІЛ чи ви маєте тип м’язів які роблять вас гарним спринтером.

В людському геномі є близько 10 мільйонів SNP, а чіп Illumina поки що може проаналізувати 1 мільйон з них (якщо точно то 966977). З тих приблизно мільйона елементів даних, наука знає що означають тільки 14515. Та й для тих останніх, ми досі не впевнені щодо всіх ознак, на які вони можуть впливати. На сайті 23andme, вони перелічують лише близько 160 SNP та їх ефекти. Це означає що з даних які я сьогодні публікую, наука досі не знає функції 952462 маркерів. Це ж ціла скарбниця інформації яка чекає щоб її відчинили! Так як наука постійно просувається вперед, ми знаємо більше про кожен маркер, і їх вплив на наше життя.

Однією з найкращих особливостей 23andme є те, що вони дозволяють скачати повний генетичний профіль з чіпу Illumina, в голому непропрієтарному форматі. Це чудові новини для здібних програмістів. Це означає що вперше в історії існує недорогий сервіс, що може отримати, декодувати та експортувати ваші генетичні дані в непропрієтарний файловий формат.

Комміт

Якщо ви розробник відкритого програмного забезпечення, ви можете зробити кілька комітів в публічний репозиторій вихідного коду, як зробив і я:

msporny@tao:~/work/dna$ git add ManuSporny-genome.txt
msporny@tao:~/work/dna$ git commit -a
[master a08b027] Added my genome into source control.
 1 files changed, 966992 insertions(+), 0 deletions(-)
 create mode 100644 ManuSporny-genome.txt

Це дало мені надію на те, що наші діти будуть отримувати набагато кращі медичні послуги ніж ми зараз. Більше того, це дало мені надію, що ми зможемо краще допомогти медсестрам, лікарям, та вченим медикам як спільноті, більше ніж грошима, але з нашим часом, досвідом та енергією. Від цього комміту по моєму хребту пробігли мурашки – для мене це символізувало світліше майбутнє для нас всіх.

І тепер, коли кожен з нас може володіти цими даними, що ми всі можемо зробити?

Аналіз ваших генетичних даних

23andme робить чудову справу даючи вам звіт з результатами в коректності яких вони впевнені, наприклад що в мене на 13.4% збільшений ризик вікової макулодистрофії. Середній – 7%, що означає що я маю приблизно вдвічі більші шанси втратити зір з віком. Це має сенс, оскільки один з моїх дідусів має важкий випадок макулодистрофії пов’язаної з віком. Існує приблизно 160 таких типів звітів, які ви можете отримати з даних 23andme, але що якщо ви хочете розібратись з кодом глибше?

Код, це код, чи це нулі та одинички, чи це A, Г, Ц, та Т. Аналіз коду і даних це те, що багато інформатиків робить часто і непогано. Подумайте про об’єми даних з якими щодня справляються Фейсбук, Ґуґл та Твіттер. Подумайте як швидко ви можете здійснити пошук крізь трильйон документів Google (в більшості випадків менш ніж за секунду).

Особисто я, очікував такий же функціонал миттєвого пошуку та аналізу на 23andme. Але його там не було. Не зрозумійте мене неправильно, 23andme чудовий сервіс, і якщо такі речі вас цікавлять ви майже напевне маєте придбати комплект. Мою слину проаналізували загалом за 150$. Але найкраще, що ви отримуєте миттєвий доступ до всіх своїх даних.

Тим не менш, пошук серед тих даних на 23andme дуже хреновий. Я вже казав, що вони дають лише 160 звітів, але існує 14515 відомих SNP. Якщо ви хочете дізнатись більше ніж розповідається в тих звітах, рекомендую сайт SNPedia.com. SNPedia – це вікіпедія для генетичної інформації. Тому, якщо хочете дізнатись щось, про що не розповідає 23andme, вам потрібно вручну шукати однонуклеотидний поліморфізм що вас цікавить на SNPedia. Щоб зробити це ще складнішим SNP названі досить заплутано, типу rs1815739.

Якщо ви шукаєте не один SNP, це може зайняти багато часу. Потрібно спочатку поглянути на оригінальний SNP, який вас цікавить на SNPедії. Після відкривання сторінки потрібного маркера, можна побачити посилання на ще десяток маркерів які впливають на особливості що ви досліджуєте. Вам потрібно вручну набрати код кожного SNP один в один на сайті 23andme, натиснути “пошук”, записати послідосність для того SNP, (наприклад “GG”, чи “AA”), і повторити процес для всіх SNP які вас цікавлять.

Що можуть зробити для генетики веб-програмісти?

Ручний пошук тих маркерів необов’язково має бути таким часозатратним. Для подібних речей в нас є комп’ютери! Ваш генетичний код поміщаєтсья в 25 мегабайтах пам’яті – маленькому, маленькому шматочку малесенької флешки. Ці дані еквівалентні 5 пісням в mp3, невеликому сайту, чи 5-7 цифровим фото. Ви можете ввести в Google “колір очей”, і отримати результат менш ніж за секунду, після пошуку по майже всьому інтернету. Чому не можна зробити це ж зі своїм генетичним кодом?

Я думаю програмісти (особливо веб-програмісти) можуть зробити краще. Це основна причина по якій я віддаю ці дані в громадське надбання. Я б хотів бачити відкритий сайт, який міг би здійснювати пошук по SNPedia швидко, як це може Google. Якщо я введу “тип крові”, він має розповісти мені все що знайде про мій тип крові. Якщо я введу “очі”, він має розповісти все про їх колір, ризик макулодистрофії, і т.д. На SNPedia є купа даних, потрібен лише гарний, персоналізований інтерфейс щоб працювати з ними.

Це лише одна ідея. Існують тисячі інших ідей прихованих десь в всесвітньому павутинні. Можливо одна з них зараз прихована в вашій світлій голові. Я сподіваюсь що ви поділитесь цією історією з іншими людьми, які можуть бути зацікавлені в зменшенні страждань світу. Я маю великі сподівання на цю нову технологію – нам пощастило бачити дивовижні прориви в охороні здоров’я ще за життя. Якщо ви знаєте як програмувати, проектувати чи кодити – ви можете допомогти. Ви можете почати написавши про це в свій блог, чи твіттер, або скачавши мій код.

Manu Sporny. Переклад мій.

Advertisements

Written by bunyk

Лютий 15, 2011 at 00:17

Оприлюднено в Павутина, Передруки

Tagged with

Відповідей: 10

Subscribe to comments with RSS.

  1. Посмотрим, что с ним будет, когда у него (если) начнутся проблемы с властями. По его же ДНК его и будут определять. Так что вся эта открытасть – хороша, пока ты ничего не натворил и не собираешься. А жизнь – штука непредсказуемая, вдруг завтра мы захотим дать отпор всемирному тоталитаризму, а будет поздно? 🙂

    jtimv

    Лютий 15, 2011 at 00:36

    • Дивись ситуацію: я приходжу до тебе в гості, знаходжу на столі волосок. І все, СБУ вже має твоє ДНК.

      Інформація має бути або для всіх, або її взагалі не має бути. Інакше це не справедливо.

      Можеш вважати це таким собі моїм категоричним імперативом – хто щось приховує – той має чого. І це єдиний критерій зла. Коли Адам почав ховатись від Бога?

      Інша справа – це есперантисти, які шифруючись мовою, яку навіть google translate не бере, готують світовий переворот:

      tuj ili montras potencon
      nomigante ĝin respondeco
      sed fakte ĝi estas atenco
      kontraŭ unu libera hom’

      sed memoru ke ili estas la pasinta generaci’
      la estontecon regos ni!

      bunyk

      Лютий 15, 2011 at 17:45

  2. Саме прикольне що один хитрожопик вже форкнув і навіть намутив пулл реквест.

    Xobb

    Лютий 16, 2011 at 01:33

  3. Я скачав генетичний код. А як його відкомпілити в клона того чувака, який цей код залишив? Чи можна його вільно змінювати (наприклад, змінити стать або зробити вдосконалену версію з двома головами)? Чи дозволяється використовувати модифікований код (і клонів) комерційно?

    Python

    Лютий 19, 2011 at 00:59

    • Далі справа за біологами. Вони вміють замінювати певні ділянки ДНК іншими.

      А зі статтю все взагалі просто – видаляєете хромосому Y, і замість неї берете чиюсь X. (Не знаю чи можна копіювати свою).

      Ну, і код в суспільному надбанні, тому з ним можна робити все що завгодно. Тим більш комерційно. Я собі не уявляю як некомерційно використати такий код, окрім звісно жартівливих рефакторингів.

      bunyk

      Лютий 19, 2011 at 07:53


Залишити відповідь

Заповніть поля нижче або авторизуйтесь клікнувши по іконці

Лого WordPress.com

Ви коментуєте, використовуючи свій обліковий запис WordPress.com. Log Out / Змінити )

Twitter picture

Ви коментуєте, використовуючи свій обліковий запис Twitter. Log Out / Змінити )

Facebook photo

Ви коментуєте, використовуючи свій обліковий запис Facebook. Log Out / Змінити )

Google+ photo

Ви коментуєте, використовуючи свій обліковий запис Google+. Log Out / Змінити )

З’єднання з %s

%d блогерам подобається це: