Викисловарь:Проект:Латышский язык

Проект:Латышский язык
Короткая ссылка-перенаправлениеGtk-redo-ltr.svg
ВС:П:lv

Приветствую вас, уважаемые латыши и русскоязычные, интересующиеся латышским. Функция данного проекта — координация развития преимущественно статей Викисловаря о латышских словах, иногда также согласование перевода русских слов на латышский язык. Постараемся обойтись без политики, однако поскольку раздел викисловаря русский и не все местные желающие нам помочь лингвисты знают латышский, поэтому рабочие языки русский и английский.

Идея: я знаю, как часто критикуется нежелание русских учить латышский язык, однако сам, как этнический латыш, не знающий латышского и живщий в России, я столкнулся с настоящей проблемой: в интернете нет по-настоящему полных, качественных словарей и метариалов для обучения на латышском языке. Мне кажется, что это в интересах самих латышей решать эту проблему :) Уже сейчас русский раздел викисловаря, обладая всего 2,5 тысячами латышских слов, является вторым по количеству латышских слов после латышскоязычного раздела! Мы обладаем 5-ю латышско-русскими словарми, каждый из которых имеет свои недостатки. Предлагаю скоординировать работу таким образом, чтобы залить ботом заготовки статей, а потом совместно переварить все 5 источников, чтобы сделать полный и качественный словарь латышско-русского языка! Если нас будет трудиться хотя бы 10 человек, то если каждый в день будет добавлять всего по 10 слов, то за две недели можно будет добавить тысячу! Это же очень много!

За вопросами, обращайтесь ко мне на страницу обсуждения — Soshial 09:59, 28 января 2012 (UTC)


См. тж. список всех слов латышского языка, составляемый вручную.
В Викисловаре имеется Проект «Латышский язык»


СтатистикаПравить

ИндексПравить

Индекс, составляемый вручную

A/Ā · B · C · Č · D · E/Ē · F · G · Ģ · H · I/Ī · J · K · Ķ · L · Ļ · M · N · Ņ · O · P · R · S · Š · T · U/Ū · V · Y · Z · Ž ·

Участники Проекта:Латышский языкПравить

Просим всех желающих принимать участие в проекте добавить свою подпись:

  1. Soshial 09:59, 28 января 2012 (UTC)
  2. Seimanis (латгальский язык)

Источники словарей в электронном видеПравить

Хотелось бы найти и вписать сюда ссылки на электронные версии словарей. --Vesailok 05:28, 25 сентября 2012 (UTC)

Конечно! С удовольствием приведу здесь список. А вы будете участвовать? Не все словари выложены в вебе, для некоторых есть только DSL файлы словарей. Ссылки на файлообменники можно тут привести? Soshial (обсуждение) 09:42, 7 октября 2012 (UTC)
Ссылки на файлообменники? Хм. Не знаю. Возможно, и можно, пока их не удалят. Латышским я занимался постольку-поскольку - 3 года в Латвии работал. Учил язык, но сейчас он мне не очень нужен, да и многое позабыл. Особенность латышского в том, что он забывается конкретно, если с ним не работаешь :( Я постараюсь вносить в данный Проект посильный вклад, постараюсь, обещать ничего не могу. --Vesailok 20:39, 7 октября 2012 (UTC)
Уважаемый Vesailok, как вы и попросили, я собрал все материалы по Латышскому языку, какие мог. Их вы можете найти на странице: Викисловарь:Список_литературы#Латышско-русские. Ко всем, которые у меня есть в электронном виде приложена ссылка на мой Dropbox. Предлагаю работать над латышско-русским направлением: довольно хороший русско-латышский электронный словарь в DSL есть, а вот подобного для латышско-русского - нет, поэтому предлагаю на Викисловаре именно его и создать. Сперва необходимо будет сделать Индекс:Латышский язык. Не подскажете, кто может помочь с этим? Сам список слов я где-нибудь раздобуду. Soshial (обсуждение) 18:03, 27 мая 2013 (UTC)
Начало индексу положено. --- Vesailok 20:16, 27 мая 2013 (UTC)
Спасибо большое, Vesailok. Большая всё-таки просьба к вам скачать все мои материалы по латышскому языку: я их ночами соскребал по всеми интернету и будет жалко, если всё пропадёт. У меня также появился большой орфоэпический словарь латышского языка с 80 тысячами слов (самый полный список слов, что я видел). Насколько физически возможно распознание словаря и создание индекса из полученного? — soshial@ 12:17, 5 июня 2013 (UTC)
В каком формате? Если изображение достаточно чёткое, то распознавание возможно. --Infovarius (обсуждение) 20:01, 5 июня 2013 (UTC)
Ура! Мне удалось натренировать FineReader так, чтобы он распознавал орфоэпические указания. Результат распознавания (ещё не вычитано) для буквы Ž выложил сюда. Что думаете о формате отображения? Ничего? Или слишком дёшево? — soshial@ 16:54, 8 июня 2013 (UTC)
Любой текстовый формат - это уже здорово! С ним работать дальше гораздо легче. Поздравляю. Между прочим русский Викисловарь - третий раздел по количеству латышских статей. --Infovarius (обсуждение) 07:40, 10 июня 2013 (UTC)
Текстовый формат это конечно здорово, но я ведь скриптами обрабатываю распознанные изображения, так что могу чуть подправить оформление — и выглядеть список будет по-другому. Мне кажется, что сейчас оно как-то уродливо выглядит. Может, подскажете, как сделать так, чтобы выглядело по-человечески и глаз радовало? ps. В английском разделе просто не может быть 60-ти тысяч: это какой-то баг точно. — soshial@ 10:35, 10 июня 2013 (UTC)
1) как заготовка для создания статей - хорошо. Потом конечно произношение в индексе уже не нужно будет. 2) 60 тыс. - это со всеми словоформами. Без них, похоже, где-то всего 4200 :) --Infovarius (обсуждение) 16:56, 10 июня 2013 (UTC)
Да, но сколько лет займёт пополнение 80.000 латышских слов, вы представляете? ;) Мне даже сложно предсказывать, учитывая, что этим занимаюсь только я (даже пока не приступил). Хотелось бы это десятилетие всё-таки иметь красиво выглядящий орфоэпический словарь :) Так что, если вам не трудно, может предложите какой-нибудь формат оформления подобного? — soshial@ 21:56, 10 июня 2013 (UTC)
Сколько времени? Если будет подобный текстовый список - около месяца, с учётом написания кода бота с нуля и самой заливки :) Так что труд по составлению списка не напрасен. --Infovarius (обсуждение) 04:27, 11 июня 2013 (UTC)
Я о другом говорил. Скрипт-то мной написан, но если я выложу эти списки, то ими будут пользоваться (орфоэпической информацией), пока каждое слово не будет добавлено с целой статьёй — я это имел в виду. — soshial@ 15:32, 11 июня 2013 (UTC)

Источники словарей в электронном виде (Часть 2)Править

А можно выложить хотя бы часть списка, например, 20 статей. А то я не совсем понял о чём идёт речь. --- Vesailok 18:31, 11 июня 2013 (UTC)

Так я как раз и выложил невычитанный результат распознавания для буквы Ž сюда. Попутно я викифицировал текст автоматически и спрашиваю, насколько такая викификация приемлема. — soshial@ 20:31, 11 июня 2013 (UTC)