Блоґ одного кібера

Історія хвороби контуженого інформаційним вибухом

Планетарний вплив вікіпедії

leave a comment »

Власне, я долучившись до створення плану тренінгів додав кілька підпунктів до пункту який ви бачите в заголовку публікації. Після цього мене двічі попросили розповісти про вклад вікіпедії в розвиток штучного інтелекту. Прийшлось придумувати презентацію. На щастя (чи на жаль, це вже ви вирішуйте) обійшлись і без неї. А тут можете і прочитати, я до письмової критики там в коментарях вже звик.

Зміст

Вклад вікіпедії:

в заміну середньовічної освітньої системи.

В розвитку “інформаційних технологій” людства можна виділити періоди якісних стрибків, пов’язаних з винайденням нових технологій.

5000 років тому знання передавались усно, і зберігались лише за допомогою людської пам’яті.

Кіпу 3000 років до н. е

Пізніше люди придумали писемність. На папірусі, чи пергаменті кращі культурні і наукові досягнення зберігались набагато краще.

Виробництво пергаменту

Проте, в книжок з пергаменту був недолік, вони були занадто дорогими, і не кожен міг собі їх дозволити. Їх тиражування теж вимагало неабиякого вміння від переписувача, який мав бути ще й художником.

Тоді для економії й придумали таку схему: викладач читає єдиний підручник, всі уважно слухають і запам’ятовують. А ще викладач може позичити книжку особливо здібному учневі, щоб той вчив на пам’ять.[1]

Університет, 1350-ті

Ну, і раз книжок було мало, то видавали лише фундаментальні, на зразок Біблії, чи Арістотеля. Це мало сприяло розвитку філософії та інших наук. Гутенбегр винайшов верстат, таким чином зробивши якісний прорив – книжки можна було швидко тиражувати.

Друкарський верстат Гутенберга. До 240 сторінок на хвилину[Джерело?].

Завдяки йому, сьогодні ми цілком забезпечені книгами. Але, вони й досі неймовірно дорогі, а їх виготовлення займає роки.

Бібліотека

Тому принцип передачі знань не змінився: один розказує, десятки слухають. В ідеалі всі отримують гарні знання. На практиці – хто що почув, і що записав. Виходить N персональних конспектів, зазвичай з білими плямами.

Сучасна лекція

Моя група якось подумала, що перед екзаменами вигідно було б робити об’єднання конспектів, потім це об’єднання тиражувати, і вчитись по ньому.

Виявилось, що вікі може здешевити цей процес до нуля, і прискорити його в рази. Особливо якщо відомі питання які треба готувати до екзамену, і кожен дасть відповідь на те яке краще знає.

Так виглядає вікіпідготовка до екзамену

Порівняно з книжкою: завжди доступна остання редакція, і час між зміною до цієї редакції і тиражування інформації між всім світом – 0 (ну, де факто кілька мілісекунд на передачу запитів по http, і запис в БД, але ви цього не помітите).

в поширення свободи слова

Вільний і рівний доступ до інформації як категоричний імператив. Будь-яке приховування інформації зло. Приклади: наука під час холодної війни, відключення інтернету в Єгипті, стрільба по журналістах, та багато інших. А все почалось дуже давно:

« І сховався Адам і його жінка від Господа Бога серед дерев раю.  »

в розвиток інформаційних систем

Інтернет важко парсити, бо він гетерогенний. Вікіпедія трохи однорідніша. Google та інші інформаційні системи, часто як найперше джерело використовують вікіпедію. Наприклад Google Maps додає інформацію про об’єкти на своїх картах з вікіпедії.

Google Maps та Вікіпедія

Google Maps та Вікіпедія

Крім того вікіпедію використовують для збирання інформації в бази даних про світ, такі як freebase, Wolfram Alpha, Cyc, та ймовірно багато інших.

Ймовірно ми зможемо скоро робити до вікіпедії запити на зразок “знайти в категорї хмарочоси України той що має найбільшу висоту, і не входить до категорії хмарочоси Києва”. Чи ще краще “кити \subset китоподібні” == True.

Це має вдатись тому, що на відміну від інших сайтів, дані вікіпедії часто мають чітко означену семантику. З координатами все ясно. Окрім того, якщо наприклад чиясь біографія входить в категорію “Вчені такої то країни”, то пошукова система знає, що це стаття про людину, в якої скоріше за все є дата народження, і Альма-матер.

Онтологія

Окрім цього, багатомовність енциклопедії дозволяє отримати великий корпус текстів різними мовами, і з зростанням їх якості зростатиме якість автоматичного перекладу систем що навчаються на паралельних текстах (хоча й статті різними мовами можуть містити різні факти).

Чому вікіпедія не стане вавилонською бібліотекою?

Вавилонська бібліотека містила всі можливі тексти фіксованої довжини і фіксованого алфавіту. Тобто все що можна було описати в ній вже описано, разом з цим текстом, і всією вікіпедією. Щоправда типовий абзац її книжки виглядає так:

BABEL,SFTPVBQP.QSAOPRXLHEDGONAASSOLMOGGOEYSXYIFLVRMGQSBQBQRTFOYERC.NTLASLVNVXTAJ
M VOYTDPE YBNQMCDDLRC NMQ MMG MPLVF.SH,NCNMLSRFEBSSMHPGX.PBMBDIELECRIMJIRRAVC CL
DEHO ,TEY.AYCTBOMYGGTOJDCDY,TBTYLR QEFMGELBGJGCSVPNISQT Q.NQMDXXNLT BQQLGRIPRIYG
MTFPRCH.FTPFPJLMT.NER,F.RPFHILE DIQXSARQXFVBLYIXSYTOGFSYAHVBS.H.TNGNMTQH JIBBHJQ
MYYMRIBDCCTVNM MXJJHETYMBYACBMHPDOJYFOJ CVF CDLJNE J GSIJ.QSPGOROXGDPBO.MAFBEIED

Виявляється єдина її проблема в тому, що хоча все є, але знайти нічого цікавого неможливо. А все тому, що якщо наприклад вважати перший рядок книжки її назвою, а такий самий рядок в іншій книжці – посиланням, то кількість посилань на кожну книжку однакова.

Поки в вікіпедії є вибрані статті, такого не станеться.

Вікіпетян в вавилонській бібліотеці. (Зауважте індекси на полицях)

Зноски

  1. Вичитав в чудесній книжці Хинкис В. “Жизнь и смерть Роджера Бэкона”, якої чомусь немає в інтернеті.
Advertisements

Written by bunyk

Лютий 27, 2011 at 00:09

Залишити відповідь

Заповніть поля нижче або авторизуйтесь клікнувши по іконці

Лого WordPress.com

Ви коментуєте, використовуючи свій обліковий запис WordPress.com. Log Out / Змінити )

Twitter picture

Ви коментуєте, використовуючи свій обліковий запис Twitter. Log Out / Змінити )

Facebook photo

Ви коментуєте, використовуючи свій обліковий запис Facebook. Log Out / Змінити )

Google+ photo

Ви коментуєте, використовуючи свій обліковий запис Google+. Log Out / Змінити )

З’єднання з %s

%d блогерам подобається це: