Блоґ одного кібера

Історія хвороби контуженого інформаційним вибухом

Posts Tagged ‘мова

Навчання на місці

leave a comment »

Навчання мови на місці ефективніше за навчання вдома, бо то постійний екзамен.

Алекс питає чи я не фолбекаю до інглішу. Ну я стараюсь, але бачте, навіть в українській фолбекаю. Часто я говорю як в цьому діалозі:

Me: Um… hast du… der… ah, fuck

German: It’s okay, friend. Learning a second language is difficult, but with enough practice and time you’ll acquire the vernacular and colloquialisms to communicate in a concordant matter vis-à-vis other Germans. I myself still struggle with the endeavor of mastering the English language, ergo, I hope I have articulated myself in a proper manner

Me:

Me:

Me: Fahrrad.

Ну а німці на щастя – ні, вони мають рівень англійської десь як мій.

Дивився німецьке TV. 50% зрозумів.

Вже маю автобус до Мюнхена, і не маю хоста. Страшненько. Букінг ком дозволяє лише на день наперед букати. Доведеться дивитись там адреси і проситись. 🙂

Written by bunyk

Січень 17, 2016 at 10:04

Оприлюднено в Нещоденник

Tagged with ,

Halt and catch fire

with 3 comments

Публікація про те як у мене і мови “все складно” і як я намагаюсь налагодити стосунки.

Halt and catch fire (“зупинитись і загорітись”) – цікава модифікація інструкції HALT, працює як написано лише на комп’ютерах з пам’яттю на магнітних сердечниках в яких збільшено струми доступу. Також телешоу все ще в розробці. Терміну вже більше 50 років (Пам’ять на магнітних сердечниках, ви знаєте що це? Отож бо, я теж не знаю.), а я про нього дізнався лише коли перекладав Dive into Python.

І от біда, я не знаю як перенести цей термін в український культурний контекст. Зрозуміло що коли Марк Пілігрим використовує термін HCF, він має на увазі що програма повинна з шумом і тріском завалитись. Але як це зрозуміло і коротко виразити?

Тим часом на вікіпедії триває війна “Зневадження” проти “Налагодження”, чи то пак навпаки. Всі словники, крім якогось там Мейнаровича-Кратко – за другий термін. Кількість результатів в Google – теж за другий, хоча в документах які він знаходить частіше йдеться про “налагодження стосунків”. Я стараюсь триматись і не лізти, тому що війна – зло. Так, там танки не горять, але суму витрачених зусиль вже можна прирівняти до десяти-двацяти черг з автомата (7.62×33 мм патрон коштує на ринку в середньому 50 центів за штуку, черга – 15$. Люди які заробляють 5-20$ за годину (ну, чи проблеми чим годувати дітей точно не мають, бо інакше б на вікіпедію не мали часу), могли б свій час використати якось приємніше, чи продуктивніше. Й не обов’язково працюючи на заводі з виготовлення патронів…)

Статтю майже ніхто (я так точно) далі назви читати не буде (бо аби справді прочитати щось корисне на цю тему – треба гуглити hg bisect та ipdb.set_trace() чи що там ви збираєтесь використовувати), то чому за неї так воюють? Тому що стояти на своєму – це приємно, а також тому що вікіпедія – таки словник, що б там не казали правила і переклад слова debug я, і напевне багато інших будуть дивитись саме там. І це зараз філологи на вікіпедію кажуть “фу, там так багато помилок, що ми туди ні ногою”, а через років 5-10 їм доведеться вивчати мовний корпус вікіпедії, і напевне адаптувати мовні норми до нього, нікуди вони дінуться.

Що ще? Занадто просте автовиправлення правопису може бути поганою ідеєю, хоча б тому що “аргументу” – це, можливо, не помилково написаний родовий відмінок “аргумента”, а давальний відмінок цього ж слова. “Графа” – це, можливо, не помилково написаний родовий відмінок слова чоловічого роду, яке означає титул, або математичну структуру, а називний відмінок іменника жіночого роду що означає поле форми наприклад. Тому я зараз активно дивлюсь в сторону hunspell, вже скачав, поставив плагін для Firefox (який здається не працює), скачав останню версію (1.6.6) словника uk_UA.dic, вивчаю його консольний інтерфейс і прив’язки до Vim та Python.

Щодо граматики, я все думаю взяти гарний україномовний корпус (де його взяти?), записати в базу 5-грами, а далі підсвічувати слова залежно від частоти знайдених в ньому n-грам. Чим рідкісніша n-грама – тим червоніший шрифт чи підкреслювання.

Written by bunyk

Квітень 16, 2013 at 11:08

Оприлюднено в Нещоденник

Tagged with ,

bwikibot 0.4.2, відтепер з автовиправленням правопису!

with 2 comments

Автовиправлення правопису, як пізніше виявилось – передчасна ідея, але суть публікації в тому що bwikibot активно розвивається і на сьогодні вже має версію 0.4.13. Очікуйте 0.5.0!
Правда не всього правопису, а лише деяких іменників чоловічого роду в родовому відмінку, але й це вже краще ніж нічого.

bwikibot встановлюється просто як:

sudo pip install bwikibot

Або, якщо цією програмою ще хтось крім мене користується (дякую вам) і вже встановив, то оновлюємо:

sudo pip install --upgrade bwikibot

Нагадаю що pip повинен бути для третього Python, підтримка другого можлива лише теоретично, якщо хтось допоможе мені з тестами.

Після чого виправлення правопису запускається командою:

python3 main.py spell "Пориньте у Python 3/Модульне тестування"

correction_diff

І якщо вказана сторінка існує на вікі, на яку він залогінений, то текст цієї сторінки буде прочитано, будуть здійснені всі можливі автозаміни, вам буде показаний диф між новою і старою версіями (треба буде подумати над тим, як зробити так аби цей диф виглядав коротшим) і після отримання від вас згоди на запис, виправлена версія записана назад у вікі.

Що він може? Небагато, поки-що. В нього є словник genitive_a_u.txt, в якому містяться слова чоловічого роду в родовому відмінку з закінченнями “а”, “у”. Словник поки що невеликий, містить сім слів: аргументу, графа, менеджменту, методу, об’єкта, параметра, файла.

Проте це слова які я не вмію правильно писати, хоча пишу часто. 🙂 Словник буде доповнюватись. Потім може ще додам словник автовиправлень частих помилок загального виду, і якісь n-грами.

Ну і щойно виявив помилку. Мій коректор хоче замінювати слово “аргументами” на “аргументуми”. 🙂 Треба згадати що там в кінці шаблону треба поставити… Здається "аргумент\b"?

А ще, коли проект виросте до справді корисного, напевне варто буде його відокремити і додати можливість перевірки і автовиправлення блоґу через xml-rpc.

Ах, і якщо хтось знає як не винаходити велосипед, а інтегрувати aspell чи щось подібне – поділіться досвідом.

Доповнення на 16:15 : Помилку з “аргументуми”, занадто довгі дифи, виправлено в версії 0.4.3, також для цієї версії тести проходяться як в Python3 так і в Python2, але вручну я тестував тільки 3.

Written by bunyk

Квітень 13, 2013 at 11:40