Блоґ одного кібера

Історія хвороби контуженого інформаційним вибухом

Генштаб для грамнацистів

with 4 comments

Щойно з’явилась ідея супер-пупер сервісу для всіх хто пише і вичитує.

Сценарії використання

  1. Користувач бачить помилку на якомусь сайті. (Ідея націлена на вікіпедію, але має працювати на будь-яких інших сайтах, наприклад тут.) Нехай він зареєстрований на нашому порталі грамнацистів, і встановив букмарклет. Користувач виділяє ту помилку, натискає на букмарклет, той букмарклет показує попап з формою, де вписаний рядок з помилкою, полем куди можна ввести правильний варіант, пояснення помилки і посилання на словники та правопис.
  2. Користувач пише статтю. Він хоче написати її грамотно. Він вводить її текст, натискає інший букмарклет, і той використовуючи алгоритм Ахо-Корасік чи щось легше, підкреслює всі помилки і в попапах показує коментарі користувачів що їх виправили, та варіанти виправлень.
  3. Користувач вважає що помилка – не помилка, і попередній користувач помилився додавши її до словника. В попапі він клацає кнопочку “обговорення” і переходить на наш портал, де може обговорити.
  4. Адміністратори/редактори (вікіпедії) вирішують хто правий, а хто ні. Помилка яка насправді такою не була, позначається, і при наступних спробах її ввести, йому будуть повідомляти що це не помилка, і якщо він не згоден – посилати в обговорення.
  5. Найпопулярніші помилки, які вже точно помилки експортуються в файл що читається роботом який лазить по вікіпедії і виправляє всі статті та перевіряє всі нові правки. Якщо користувач вніс правку з помилкою – йому приходить повідомлення з поясненням суті помилки, проханням так не робити і порадою поставити букмарклет. 🙂 На зразок такого:
    https://www.facebook.com/mova.ukr/posts/723929884309871
  6. Треба врахувати те, що помилок існує більше ніж правильних слів (наприклад в слові “пиво” можна помилитися 32^4 = 2^{20} \approx 10^6 мільйоном різних способів, і то якщо не враховувати що також існують пропуск, дефіс, апостроф та інші символи. Тому варто намагатись вводити лише часті помилки, а решту залишати на hunspell. Словник для hunspell теж дозволити редагувати спільно, через букмарклети.

P.S. Я ще можу змиритись з тим що Firefox мені підкреслює hunspell, latex, букмарклет, попап і подібне. Але “блозі”, “кнопочку” “P.S.” і т.п. міг би вже вивчити.

Advertisements

Written by bunyk

Березень 19, 2015 at 21:22

Відповідей: 4

Subscribe to comments with RSS.

  1. Годиться лише для випадків, коли в результаті помилки ми отримуємо неіснуюче слово. Якщо ж, наприклад, користувач виявить, що замість одного відмінку було використано інший, то «помилковим» ризикує стати будь-яке використання даної форми слова (у т.ч., там, де цього вимагають правила). Додаймо до цього вільний порядок слів у реченні, властивий українській мові — тобто, навіть алгоритмічно визначити з контексту очікувану відмінкову форму (щоб уникнути зайвих «виправлень») вже є нетривіальною задачею.

    pythonfrompalm

    Березень 21, 2015 at 12:21

    • Так, звісно. Але для помилки “так як”, чи ось наприклад для являє собою може згодитись.

      Крім того не всі люди які бачать помилки, знають що їх виправлення можна автоматизувати.

      bunyk

      Березень 22, 2015 at 16:39

  2. 32^4=2^2*0~=10^6

    не вичитував свою статтю?

    danbst

    Березень 21, 2015 at 16:28

    • Ні, нашвидкоруч занотував щоб з голови не вилетіло. Постійно забуваю що в теху більше одного символа в верхньому індексі треба брати в блок.

      bunyk

      Березень 22, 2015 at 16:40


Залишити відповідь

Заповніть поля нижче або авторизуйтесь клікнувши по іконці

Лого WordPress.com

Ви коментуєте, використовуючи свій обліковий запис WordPress.com. Log Out / Змінити )

Twitter picture

Ви коментуєте, використовуючи свій обліковий запис Twitter. Log Out / Змінити )

Facebook photo

Ви коментуєте, використовуючи свій обліковий запис Facebook. Log Out / Змінити )

Google+ photo

Ви коментуєте, використовуючи свій обліковий запис Google+. Log Out / Змінити )

З’єднання з %s

%d блогерам подобається це: