Где-то прочитал об интересном способе изучения языка - параллельном чтении текстов. Для примера была приведена Библия, как наиболее точно и полно переведённое произведение из всех существовавших на Земле. Значительный плюс Библии - разбивка на мелкие участки в виде стихов и однозначная их нумерация. Некоторый минус - язык Библии далёк от разговорного и даже от привычного книжного. Но так как мне сейчас очень интересен финский, а там пока ещё нет такого деления на древний/мёртвый и современный, то оказывается эти тексты вполне можно применять для изучения. Библию на русском читал давно, так что для повышения чувства собственной важности было бы неплохо обновить "популярные места", мало ли кого придётся цитатой за пояс заткнуть или, еще лучше, уличить в неверном цитировании. :)
Финский и немецкий у меня сейчас на абсолютном нуле и такое чтение дает некую первоначальную загрузку, т.к. вроде смысл понятен, есть воображаемая картина и тут уже есть некоторые слова. Мой английский на уровне "чтения технической литературы", так что такое чтение очень разнообразит лексикон в части вариантов употребления, синонимии (а то ведь у многих слов знаю только технические значения). Украинский надыбал случайно, вместе с русским и английским и оставил в проекте чисто поржать. Хохлосрачи не люблю, но русская бытовая и сниженная лексика на самом деле имеет много заимствований из украинского и воспринимать серьёзные вещи на украинском с непривычки довольно тяжело.
Скрипт для выковыривания из найденных в интернете HTML файлов и интерфейс к полученной БД писал глядя на ночь, на всё про всё потратил почти 5 часов. Так что, если будут видны ошибки парсинга, просьба писать в комментах. Могу, естественно, поделиться базой со всеми желающими, чтоб кому-то лишний раз с html не мучиться. У меня получилось 2 таблицы - книг и стихов. Названия книг, правда, только на русском, английском и немецком.
