Это архив форума за 2013 г. Текущая страница обсуждения технических вопросов - здесь. Архивы обсуждений: 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 | текущее

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.


Расширение Extension:Variables править

Описание тут: Extension:Variables

Предлагается подключить его к здешнему движку.

И тогда можно будет заменить приписывание всяких "/ru" и "lang=ru" скрытой автоматизацией: в шаблоны типа Шаблон:-ru- добавить функциональность "текущий язык — такой-то", а потом где надо можно будет извлекать значение этого текущего языка; кроме того, параллельно можно будет считать, сколько всего языков было (чтобы в самом низу статьи не заботиться о параметре шаблона Шаблон:multilang). И вообще переменные вещь полезная. -- M. G. J. (обсуждение) 09:06, 21 декабря 2013 (UTC)Ответить[ответить]

  • Этот запрос ни к чему не привёл или я ошибаюсь?--Cinemantique (обсуждение) 10:00, 21 декабря 2013 (UTC)Ответить[ответить]
  • Там же написано «It is much like a template, only very lightweight and scoped to only a single page, so you can use many variables on a page without slowing down the wiki with huge numbers of templates.» Нам это ничем не поможет. на странице может быть несколько языковых разделов. Одной переменной или шаблоном не обойтись. Don Rumata 15:27, 22 декабря 2013 (UTC)Ответить[ответить]
    • Там повыше написано: «allows you to define a variable on a page, use it later in that same page or included templates, change its value, possibly to a value given by an expression in terms of the old value, etc.» В каждом новом заголовке языкового раздела и делаем этот ченч. Одной переменной обходясь. -- M. G. J. (обсуждение) 15:38, 22 декабря 2013 (UTC)Ответить[ответить]
      Одной переменной не достаточно, чтобы параллельно считать, сколько всего языков. Я бы предпочёл, чтобы поскорее нам дали возможности Wikidata. Don Rumata 17:42, 22 декабря 2013 (UTC)Ответить[ответить]
      А, вот вы о чем. Ну пускай будет две переменные, какая разница. Хотя и одной обойтись тоже можно, например, понимая ее значение как 1000*(число языков)+(код языка)... -- M. G. J. (обсуждение) 23:25, 22 декабря 2013 (UTC)Ответить[ответить]
      Я всё же надеюсь, что такая информация как принадлежность слова к языку рано или поздно будет храниться в Викиданных. По поводу подключения нестандартных расширений у меня большой пессимизм и большие сомнения в том, что это поможет. Сдаётся мне, что переменные, установленные на странице, не будут видны в коде шаблонов, включённых на этой странице. Don Rumata 23:58, 22 декабря 2013 (UTC)Ответить[ответить]
      Обещано, что будут видны: «allows you to define a variable on a page, use it later in that same page or included templates, change its value, possibly to a value given by an expression in terms of the old value, etc.» -- M. G. J. (обсуждение) 00:25, 23 декабря 2013 (UTC)Ответить[ответить]

Не хватает прав, чтобы сделать из страницы редирект править

Страница переливатьcя является клоном страницы переливаться.
Разница в заголовках: первый из них содержит английскую букву "c", второй же (правильный) состоит только из русских букв.
Что касается содержимого, то во второй странице оно более полное, а в первой нет никакой уникальной информации.
Вердикт: первую страницу либо необходимо удалить, либо сделать из нее редирект на вторую страницу. --Vitalik7 (обсуждение) 20:26, 10 декабря 2013 (UTC)Ответить[ответить]

Вот еще клоны: улепетывать / улепётывать (е/ё). Правда, ситуация несколько сложнее (содержимое немного отличается, в частности семантика). --Vitalik7 (обсуждение) 21:05, 10 декабря 2013 (UTC)Ответить[ответить]
В качестве доказательства ошибочности существования статьи улепетывать (через "е") можно привести тот аргумент, что внутри статьи: и заголовок, и содержимое оперирует именно со словом через букву "ё", а не "е". --Vitalik7 (обсуждение) 10:31, 11 декабря 2013 (UTC)Ответить[ответить]
Последние два случая уже "исправлены" редиректом, но мне кажется, что ошибочные варианты лучше вообще удалить (также как поступили с ­пристальность немного выше). --Vitalik7 (обсуждение) 18:11, 14 января 2014 (UTC)Ответить[ответить]
 Сделано --- Vesailok 18:42, 14 января 2014 (UTC)Ответить[ответить]
Спасибо за оперативность! :) --Vitalik7 (обсуждение) 18:44, 14 января 2014 (UTC)Ответить[ответить]
  • В прошлый раз я запускал скрипт поиска мешанины латиницы и кириллицы в заголовках словарных статей только для тех, что содержали в себе {{-ru-}}. Сейчас попробовал это сделать вообще для всех статей (и для редиректов в том числе).
    Результаты получились довольно неожиданные: смотреть здесь.
    Я выделял латиницу красным и если статья является редиректом, то указывал это в скобках.
    Условно все случаи можно разделить на такие группы:
    • слова, являющиеся в общем-то правильными (например, SIM-карта, POS-терминал и др.)
      некоторые из них можно отфильтровать по принципу: дефис разделяет латинскую и кириллическую части, некоторые можно добавить в исключения (например, ВИD)
    • ошибочное использование латинского символа вместо кириллического: cоучастие, пiсня, центрoфуга, пиjаца и т.д.
      прошу обратить внимание, что символы "i"/"і", "j"/"ј" являются разными символами, также как и "c"/"с", "o"/"о" и прочие, не смотря на то, что выглядят абсолютно одинаково
    • ошибочное использование кириллического символа вместо латинского: konstruktorе, tibbiеt, аbrasion и т.д.
      собственно, все аналогично прошлому пункту
    • возможно старые редиректы, которые может стоит просто удалить? Корень:wegh, Спряжение глагола abaisser, Index ц, Суффикс:ar и т.д.
      не очень красиво, что они попадают в основное пространство, к тому же корни и суффиксы у нас вроде принято называть так: wegh-, -ar-, спряжения находятся в пространстве "Приложения:", индексы в "Индекс:" и т.п.?
Скрипт поиска работает всего полминуты, поэтому если нужно будет запустить его заново — это не проблема. --Vitalik7 (обсуждение) 23:17, 15 января 2014 (UTC)Ответить[ответить]
Работы невпроворот. :) Предлагаю взяться за это всем миром. А здесь можно решить, что делать с ошибочными редиректами. Кто-то, может быть, хочет их оставить?--Cinemantique (обсуждение) 02:06, 16 января 2014 (UTC)Ответить[ответить]
С последними редиректами надо ещё подумать/обсудить. Может быть, удобнее иметь аффиксы в своих пространствах имён? Где держать полные спряжения (а в некоторых языках это могут быть огромные таблицы)? В англ.Викисловаре, кажется, держат в основной статье в свёрнутом виде, во франц. выносят на отдельную страницу (или наоборот). Но "Index ц", конечно, не нужны. --Infovarius (обсуждение) 09:39, 17 января 2014 (UTC)Ответить[ответить]
Может быть, удобнее иметь аффиксы в своих пространствах имён? — нет, аффиксы это словарные статьи. Где держать полные спряжения? — согласно ВС:ПОС — только в разделе «Морфологические и синтаксические свойства». Don Rumata 13:10, 17 января 2014 (UTC)Ответить[ответить]
Какое в итоге примем решение относительно именования морфем (аффиксов, корней и пр.)? Суффикс:ar или -ar-? Или остаются (и внедряются) оба эти варианта с редиректами от одной схемы к другой? Какая схема в таком случае будет считаться основной, а какая дублирующей? --Vitalik7 (обсуждение) 13:44, 17 января 2014 (UTC)Ответить[ответить]
Всё будет как и раньше. Никаких префиксов Суффикс: не нужно. Суффиксы начинаются с дефиса -ar, префиксы заканчиваются им. Зачем описывать корни я вообще не понимаю. Для этого есть раздел «Родственные слова» и Шаблоны родственных слов/ru. Don Rumata 14:01, 17 января 2014 (UTC)Ответить[ответить]
Отлично, тогда почти все найденные ошибки могут быть со временем исправлены.
Касательно корней и родственных слов, у первого способа (выделение корня в отдельную статью) есть несомненное преимущество: не нужно дублировать информацию и следить за тем, чтобы она была одинаковой (за исключением одного слова, текущего) для всех родственных слов. --Vitalik7 (обсуждение) 14:10, 17 января 2014 (UTC)Ответить[ответить]
Некоторый итог: общими усилиями участников пока были удалены 63 ошибочных элемента, осталось еще 350.
Я начал работу по написанию системы автоматизированного поиска ошибок в Викисловаре. Пробую изначально сделать ее удобно расширяемой. Ошибки ищутся либо по мере добавления/удаления новых записей в БД ("инкрементная проверка"), либо с помощью обхода всей локальной БД ("полная проверка"). Локальная БД (которая потом скорее всего будет перемещена на внешний хостинг), как я писал ранее, автоматически обновляется за счет информации из Свежих правок и Журнала переименований.
На данный момент пока есть только отчет по "Латинице и кириллице" и три пустышки: Участник:Vitalik7/Ошибки
Но в дальнейшем будем добавлять туда новые проверки --Vitalik7 (обсуждение) 03:23, 18 января 2014 (UTC)Ответить[ответить]
Коллега, не нужно считать любое смешение латинских и кириллических букв в заголовках статей неверным. Такие статьи как kostь, -ациj, загаhан верные, но некоторые другие нет. Нужно проверять на соответствие алфавиту языка указанного в статье. Для некоторых трудно набираемых букв, похожих на латинские, например "i" и "і" (кiтва), "j" и "ј" (плагиjатор) лучше оставлять перенаправление. Don Rumata 11:24, 18 января 2014 (UTC)Ответить[ответить]
Да, я согласен. Это пока просто отчет по смешению символов. Наверное, стоит переименовать "ошибки" в нечто иное.
Касательно других алфавитов нужно будет серьезнее исследовать этот вопрос и доработать алгоритм, чтобы было меньше ложных срабатываний.
Относительно "i" и "j" тоже согласен, это очень даже имеет смысл. Стало быть, нужно добавить такие перенаправления для случаев использования этих символов в качестве кириллических? Есть ли еще подробные случаи, когда перенаправление необходимо оставлять? Надо ли сопровождать его каким-нибудь категоризирующим шаблоном типа "ошибка" или "опечатка"? --Vitalik7 (обсуждение) 14:38, 18 января 2014 (UTC)Ответить[ответить]

Значок править

Как поставить маленькую закрывающую угловую скобку (>) под буквой? Здесь не смог найти.--Cinemantique (обсуждение) 10:19, 25 ноября 2013 (UTC) .........Похоже, что это ͕, только он не дружит с кириллицей.--Cinemantique (обсуждение) 16:04, 26 ноября 2013 (UTC)Ответить[ответить]

Под буквой? Это как? И для чего это нужно? Don Rumata 06:54, 28 ноября 2013 (UTC)Ответить[ответить]
Работает, но с русскими кривовато. Основное предназначение МФА, поэтому видимо и не работает. Хотя может быть проблема в конкретном шрифте... --93.81.76.146 11:13, 1 декабря 2013 (UTC)Ответить[ответить]
ш͕
Точнее не МФА, а УФА --93.81.76.146 16:32, 1 декабря 2013 (UTC)Ответить[ответить]
В общем, нужно использовать правильный шрифт (юникодный) и тогда всё будет ок w:en:Unicode font, w:en:Open-source Unicode typefaces. --93.81.76.146 22:48, 1 декабря 2013 (UTC)Ответить[ответить]

Небольшая проблема в оформлении править

В теме оформления «Векторное» в левом меню заголовки блоков «Инструменты» и «Языки» с прописной буквы, а «сообщество» со строчной.--Cinemantique (обсуждение) 22:12, 22 ноября 2013 (UTC)Ответить[ответить]

 Исправлено. Don Rumata 06:56, 28 ноября 2013 (UTC)Ответить[ответить]

Права администраторов, доступ к БД и удаление словарных статей править

Два вопроса (простое любопытство). Прочитал в описании mediawiki, что у администраторов есть доступ к БД (только чтение с помощью запросов SELECT), а также, что удалённая страница хранит свою историю изменений и может быть восстановлена. С Викисловарем получается то же самое? Два уточнения: доступ к БД получается прямой или только через веб-интерфейс? Обычные пользователи не могут видеть историю изменений удаленной страницы, верно? --Vitalik7 (обсуждение) 18:51, 22 ноября 2013 (UTC)Ответить[ответить]

Русский перевод мягко говоря неточен «Older versions of Mediawiki before 1.11 required you to manipulate the database records within MySQL in order to grant users certain rights.» — В старых версиях Mediawiki до 1.11 для предоставления пользователям определенных прав потребовалось, чтобы администраторы умели работать непосредственно с базой данных MySQL. Теперь для этого есть специальные средства. Администраторы не имеют прямого доступа к базе данных. На второй вопрос ответ — да, администраторы могут просматривать историю изменений удаленной страницы и даже восстанавливать её, а обычные пользователи нет. Don Rumata 19:34, 22 ноября 2013 (UTC)Ответить[ответить]
Спасибо! Да, действительно очень странный перевод, в оригинале и правда об этом вообще ни слова. Т.е. у администраторов нет никакого дополнительного доступа к словарным статьям (БД, архив/дампы, доп. фильтры/поиски или что-нибудь еще в этом роде), а только некоторый соответствующий дополнительный функционал по управлению (удаление/восстановление, защита/патрулирование, назначение прав и прочее), верно? --Vitalik7 (обсуждение) 21:42, 22 ноября 2013 (UTC)Ответить[ответить]
Возможно, вам пригодится это?--Cinemantique (обсуждение) 22:04, 22 ноября 2013 (UTC)Ответить[ответить]
Ух ты! Спасибо, действительно полезная возможность. Жаль только, что эти дампы делаются всего два раза в месяц.
Я работаю над считыванием вики-текстов всех словарных статей в свою локальную БД, а также над скриптами, которые смогут на основании "Свежих правок" обновлять это содержимое и всегда держать БД в актуальном состоянии. Эти дампы могут быть дополнительной проверкой правильности загруженных данных. --Vitalik7 (обсуждение) 22:40, 22 ноября 2013 (UTC)Ответить[ответить]
Вы всегда можете сделать дамп страниц из какой-либо категории по запросу на странице Служебная:Экспорт. Don Rumata 23:03, 22 ноября 2013 (UTC)Ответить[ответить]
Спасибо, действительно полезная возможность. Однако подход с полным созданием локальной БД все-таки имеет свое преимущество в том, что позволяет легче и быстрее поддерживать постоянную актуальность данных (достаточно лишь обновить содержимое последних статей из "Свежих правок"), а также быстро определять и реагировать на эти свежие изменения. Такой подход будет полезен в таких будущих возможных начинаниях, как автоматическое создание/обновление Индекса, словоформ, списков крассных ссылок, обратного словаря и прочее. --Vitalik7 (обсуждение) 21:36, 24 ноября 2013 (UTC)Ответить[ответить]

автоматизация построения возвратных форм править

Новый шаблон. Тоже для уменьшения числа вариантов спряжения.

  • {{ся|смотрел}} → смотрелся
  • {{ся|смотрела}} → смотрелась
  • {{ся|смотреть}} → смотреться
  • {{ся|смотри́}} → смотри́сь
  • {{ся|смотрѣлъ}} → смотрѣлся

В общем, -ся после согласных, -сь после гласных.

Годится почти на все случаи жизни, кроме некоторых форм 2 л. мн. ч. пов. накл. (у которых бывает чередование -ти/-ться или -ть/-тись), причастий (у которых всегда -ся, независимо от последней буквы) и деепричастий на -в (у которых возвратного соответствия нет, только -вши/-вшись).

Предложения/замечания? --M. G. J. (обсуждение) 06:24, 22 ноября 2013 (UTC)Ответить[ответить]

Не очень понятно, как вы предлагаете реализовывать подобный шаблон? Don Rumata 19:43, 22 ноября 2013 (UTC)Ответить[ответить]
Он уже реализован. Шаблон:ся. -- M. G. J. (обсуждение) 20:01, 22 ноября 2013 (UTC)Ответить[ответить]
Любопытно. Я давно хочу переписать шаблоны словоизменений на Lua. Можно попробовать этот алгоритм для автоматического формирования форм возвратных глаголов. Don Rumata 00:03, 23 ноября 2013 (UTC)Ответить[ответить]

автоматизация чередований в глагольных основах править

Вот сделал нечто для уменьшения числа разных подвариантов шаблонов спряжения.

  • простейшее использование:
    • {{чередование|хот}}у → хочу
  • основной предполагаемый вариант использования (после шипящих само ставит другое окончание):
    • {{чередование|хот|ю|у}} → хочу
    • {{чередование|люб|ю|у}} → люблю
  • при отсутствии чередования тоже работает:
    • {{чередование|жен}}ю → женю
    • {{чередование|жен|ю|у}} → женю
  • для глаголов с пометой -щ- (т. е. при чередовании т/щ вместо стандартного т/ч) использовать с 4 параметрами (если 4-й параметр отсутствует или не "щ", то будет по стандарту):
    • {{чередование|обогат|ю|у|щ}} → обогащу
  • или так:
    • {{чередование|обогат|у||щ}} → обогащу
  • аналогично для образования причастий при помете -жд- (имея в виду чередование д/жд вместо стандартного д/ж):
    • {{чередование|род|ённый||жд}} → рождённый

Замечания/предложения? --M. G. J. (обсуждение) 19:05, 21 ноября 2013 (UTC)Ответить[ответить]

Можно вопрос немного не по теме? А для написания этих шаблонов используются какие-то дополнительные средства, кроме собственно блокнота? Очень страшно и не понятно на первый взгляд смотрятся строки вида:
-->|з={{#invoke:string|sub|{{{1}}}|1|-2}}ж{{#if:{{{3|}}}|{{{3}}}|{{#if:{{{2|}}}|{{{2}}}}}}}<!--
Легко пропустить где-нибудь скобочку. Составлять и отлаживать шаблоны, наверное, весьма непростое занятие? --Vitalik7 (обсуждение) 21:59, 22 ноября 2013 (UTC)Ответить[ответить]
Есть специальные страницы для отладки Служебная:Развёртка шаблонов и Служебная:Песочница для шаблонов. Don Rumata 23:22, 22 ноября 2013 (UTC)Ответить[ответить]
Спасибо большое! Действительно с их помощью будет немного проще --Vitalik7 (обсуждение) 21:44, 24 ноября 2013 (UTC)Ответить[ответить]
Даже без блокнота, прямо тут в окошке редактировалось. Там на самом деле код простой. Для данной строчки: «(в случае, если у основы последняя буква есть) "з", выведи начальную часть основы (без последней буквы), потом "ж", а потом -- если есть третий параметр, то его, а если третьего нет, но есть второй, то его». --M. G. J. (обсуждение) 14:53, 24 ноября 2013 (UTC)Ответить[ответить]
Спасибо большое за разъяснения! Для понимания/написания таких шаблонов явно нужен навык и привычка. Неподготовленному человеку это видится слишком страшным мельтешением фигурных скобок и вертикальных черточек. Смысл я вроде бы улавливаю, однако держать его в голове хотя бы только для этой одной строки получается довольно трудно, постоянно сбиваюсь при подсчете скобок и определении вложенностей, очень не хватает хоть какой-нибудь синтаксической подсветки :) --Vitalik7 (обсуждение) 21:44, 24 ноября 2013 (UTC)Ответить[ответить]

Параметр соотв в шаблонах спряжения править

Господа, важное изменение в шаблонах спряжения глаголов. Видовые пары глаголов, переданные в параметре соотв= теперь с помощью шаблона {{aslinks}} автоматически преобразуются в ссылки. Параметр соотв-мн= лучше больше не использовать. Если вам необходимо задать ссылку на раздел статьи, то для этого можно использовать обычную викиразметку. Например:

  • |соотв=[[#уреза́ть|уреза́ть]] — для ссылки на раздел внутри статьи, см. урезать
  • |соотв=[[вычитать#вычита́ть|вычита́ть]] — для ссылки на раздел другой статьи, см. вычесть

Во всех остальных случаях разметку добавлять необязательно. Например:

  • |соотв=свить — для ссылки на одну статью, см. свить
  • |соотв=спеть, пропеть — для ссылки на несколько статей, см. петь

Желающие могут заняться заменой соотв-мн= на соотв=. Don Rumata 19:15, 19 ноября 2013 (UTC)Ответить[ответить]

Это касается только русских глаголов или и украинских тоже? (я про замену соотв-мн= на соотв=, т.к. в нескольких украинских словах первый вариант также встречается) --Vitalik7 (обсуждение) 14:23, 19 января 2014 (UTC)Ответить[ответить]
Это касается только русских глаголов. Don Rumata 13:51, 29 января 2014 (UTC)Ответить[ответить]
Спасибо, я так и предположил. Собственно бот уже это исправил и теперь в русских глаголах по идее нигде не используется параметр соотв-мн=.
Однако, возникли некоторые дополнительные моменты в связи с использованием соотв= вместо соотв-мн= (не совсем корректная фраза с множественным числом, выделение лишних слов в виде ссылок и прочее). Это надо дорабатывать глагольный шаблон. Обсуждение зародилось на странице бота: Обсуждение_участника:Vitalik7Bot, там же я разместил некоторые отчеты по этому поводу. — Vitalik7 обс 13:57, 29 января 2014 (UTC)Ответить[ответить]

Актуальная лексика (идея для бота) править

У меня появилась идея для бота, которую я сам воплотить в жизнь не сумею, но, может быть, появятся желающие сейчас или в будущем. Цель работы — создание списка недостающих статей по материалам современной прессы. Это актуальная лексика, которую читатель может искать не в последнюю очередь и появление которой в Викисловаре может способствовать росту популярности проекта. Как мне представляется, работа может проходить следующим образом: с определённой частотой (например, раз в неделю) бот собирает новые статьи с заранее установленных сайтов СМИ, анализирует их и выбирает слова, статьи о которых отсутствует здесь. Подобную работу я уже видел в английском ВС; если потребуется, поищу ссылки.--Cinemantique (обсуждение) 13:24, 17 ноября 2013 (UTC)Ответить[ответить]

Замечательная идея! Мне очень нравится. Я думаю, что когда появится время (скорее всего ближе к декабрю, там у меня немного освобождаются субботы), смог бы попробовать за нее взяться. Если кто-то еще возьмется за эту задачу, то это будет даже лучше, можно либо объединять усилия, либо двигаться параллельно, в любом случае это будет полезно.
Несколько мысле-вопросов по этому поводу:
  1. Таким образом возможно будет ловиться в том числе и профессиональный сленг. В связи с этим (да и не только в связи) вопрос, допустимо ли в Викисловарь добавлять нелитературный профессиональный жаргон? Например, у нас, программистов, очень много устоявшихся слов и выражений, которые часто используются в устной (да и письменной, если это переписка по теме) речи, но литературными их назвать очень сложно, часто это просто кальки с англоязычных терминов.
  2. При простом подходе анализа статей сайтов будет ловиться большое число словоформ. При этом если бы эти словоформы (для известных слов) уже существовали в словаре — было бы проще идентифицировать новые слова. Спрашивал немного ниже, спрошу и здесь: одобряете ли (вопрос ко всему сообществу) идею автоматического добавления известных словоформ в Викисловарь с помощью бота?
  3. Последний момент: скорее всего будут ловиться в том числе и опечатки. Даже если сайт хороший и проверенный, я думаю он не застрахован от появления опечаток в своих статьях. Добавлять слова-опечатки в Викисловарь — казалось бы нонсенс. Но может быть это имеет смысл для некоторых особых случаев? Например, «искуство» редирект на → «искусство» или «мажёр» → «мажор», как это в некоторой степени делают Гугл и Яндекс (понимаю, что у них там заложены соответствующие алгоритмы, но все же).
За любые ссылки по теме был бы, конечно, благодарен. А также стоит подумать, какие сайты можно взять за основу для мониторинга новых слов --Vitalik7 (обсуждение) 18:26, 17 ноября 2013 (UTC)Ответить[ответить]
  1. допустимо ли в Викисловарь добавлять нелитературный профессиональный жаргон? — да, мы добавляем все слова, но нужно указывать их лексическую принадлежность шаблонами {{жарг.}}, {{сленг}} и т.п.
  2. добряете ли (вопрос ко всему сообществу) идею автоматического добавления известных словоформ в Викисловарь с помощью бота? — в будущем, когда-нибудь да, но на данном этапе это делать не нужно.
  3. Добавлять слова-опечатки в Викисловарь — казалось бы нонсенс. Но может быть это имеет смысл для некоторых особых случаев? — да, какое-то время мы добавляли явные ошибки с помощью шаблона {{wrongname}}, который собирает их в категории Викисловарь:Ошибки. Об этом есть упоминание в ВС:ПН. Следует учесть, что таким «словам» не место в основном пространстве словаря, и их необходимо заменять перенаправлением в пространство «Викисловарь:Ошибки/». И опять же, создание таких перенеправлений не является целью. Обычно они появляются как замена многократно воссоздаваемых анонимами статей с ошибкой в написании.
Теперь несколько слов по-поводу ботов и поиска слов. Господа, не нужно брать на себя несвойственные нам функции. Мы по большей части используем вторичные источники, т.к. у нас есть требование ВС:ПРОВ. Мы не занимаемся лингвистическими исследованиями. Для этого есть НКРЯ и другие проекты корпусной лингвистики. Don Rumata 08:37, 18 ноября 2013 (UTC)Ответить[ответить]
Я считаю, что добавление не статей о формах слов, а редиректов со словоформ - полезно. --- Vesailok 11:32, 18 ноября 2013 (UTC)Ответить[ответить]
По поводу ВС:ПРОВ - там есть замечательный пункт "7. результаты поиска в поисковых системах", который очень удобно покрывает случай с новыми словами, которых нет в старых словарях. --Vitalik7 (обсуждение) 14:41, 18 ноября 2013 (UTC)Ответить[ответить]
Есть некоторые непонятки (а скорее нежелательность) насчёт слов типа самсунговский, джорджбушевский, Сибнефть… В любом случае не подходят слова, встречающиеся у одного автора (в английском ВС есть также правило о том, что между двумя упоминаниями должен быть временной отрезок не менее года). И лучше сразу отбрасывать всё некириллическое (названия фирм, газет, продуктов).--Cinemantique (обсуждение) 14:52, 18 ноября 2013 (UTC)Ответить[ответить]
Пункт 7 нужно бы удалить от греха подальше, заменив на результаты поиска в books.google.com, корпусах текстов и текстах книг онлайн библиотек. Don Rumata 19:54, 18 ноября 2013 (UTC)Ответить[ответить]
Каким образом в таком случае предполагается пополнять Викисловарь профессиональным сленгом? --Vitalik7 (обсуждение) 11:37, 19 ноября 2013 (UTC)Ответить[ответить]
Возможно, седьмой пункт и следует пересмотреть (но не в рамках данной дискуссии), но чем вам не угодили СМИ? Это не литературный язык? Я считаю, что если какое-то слово было в более или менее устоявшемся употреблении в течение определённого времени в прессе (критерии можно обсудить), то о его значении захочет узнать как нынешний «читатель газет», так и будущие читатели и исследователи. В будущем, конечно, оно может попасть в словари. Но зачем нам ждать? Нужно использовать конкурентное преимущество (хе-хе). И кроме того, если какая-то статья или газета не вошла в НКРЯ, то это проблема корпуса, его полноты и обновляемости; не следует его недостатки экстраполировать на наш проект.--Cinemantique (обсуждение) 15:17, 19 ноября 2013 (UTC)Ответить[ответить]
Согласен, крупные новостные источники нужно бы тоже упомянуть, но простой гугл-тест на существование слова многократно себя опроверг. Кстати, в НКРЯ есть газетный корпус. Don Rumata 16:44, 19 ноября 2013 (UTC)Ответить[ответить]
  • Действительно, основная трудность в этой работе состоит в том, чтобы не только отсеивать словоформы, представленные в ВС, но и по возможности лемматизировать неизвестные словоформы, т. е. вместо ряда «ретинового, ретиновую, ретиновыми…» хотелось бы на конечном этапе получать в списке только «ретиновый». Я думаю, эта проблема решаема, но нужно приложить некоторые усилия. Отмечу, что конечной целью для бота является формирование списка «красных» ссылок; статьи по ним в дальнейшем создаются (или не создаются, отбрасываются) вручную людьми, которые оценивают соответствие найденных единиц требованиям ВС. Надеюсь, это замечание снимает претензию DonRumata; никакого особенного лингвистического исследования я здесь не вижу (разве что я сам занимаюсь таким исследованием, только очень топорно и на ограниченном пространстве, притом многие «новинки» уже занесены в печатные словари). Список источников можно будет сформировать, когда найдётся желающий заняться этой работой или создать инструмент для неё; издания можно добавлять постепенно, начав с солидных и популярных изданий, для которых характерна новая лексика (но не зашкаливает).--Cinemantique (обсуждение) 13:42, 18 ноября 2013 (UTC)Ответить[ответить]
    По поводу "лемматизации" есть очень удобное средство mystem, использовал его в своих скриптах неоднократно. Умеет адекватно работать с неизвестными словами --Vitalik7 (обсуждение) 14:41, 18 ноября 2013 (UTC)Ответить[ответить]

Словоформы как отдельные словарные статьи (редиректы) + переносы строк править

Не раз встречал на просторах викисловаря словоформы в виде отдельных словарных статей. При этом они просто являются страницами-редиректами на базовую форму слова.
Пример: базовая форма азартный и словоформы азартная азартного азартное азартной азартном азартному азартною азартную азартные азартным азартными азартных — все представлены в полном списке слов Викисловаря
Вопрос 1: Верно ли я понимаю, что это нормальная одобренная практика? Каждое слово имеет право существовать в Викисловаре, в том числе и любая словоформа, правильно?
Вопрос 2: Допускается ли (полезно ли, удобно ли, нужно ли) аналогичное использование всех доступных в словарях словоформ для формирования Индекса, составляемого вручную (либо же автоматическими скриптами на основании других словарей)? Или, возможно, для такого списка лучше сделать отдельные страницы (т.е. Индекс со словоформами и отдельно еще Индекс без словоформ)? Технически это не трудно будет сделать. --Vitalik7 (обсуждение) 11:31, 17 ноября 2013 (UTC)Ответить[ответить]

В настоящее время практика такова: При условии отсутствия омонимичных форм (в том числе в других языках) и в случае, если данная форма позволяет с точностью до 100% установить исходную словарную форму, то мы делаем перенаправление. Кроме того, желательно, не только делать редирект, но и указать один или несколько шаблонов Словоформа. Разрешается делать отдельные статьи для словоформ, значительно расходящихся по написанию со словарной формой (пример: ею, её ...), а также для словоформ типа маня, поскольку необходимо шаблоном Cf указать на существование слова Маня. --- Vesailok 13:52, 17 ноября 2013 (UTC)Ответить[ответить]
Спасибо за подробный ответ! Несколько уточняющих вопросов:
  1. На данном этапе, если для некоторой словоформы в Викисловаре до сих пор нету ни единой омонимичной конструкции, то можно считать это достаточным, чтобы добавить ее обычным редиректом? (как, например, было сделано для словоформ слова азартный в примере выше)
  2. Сами словоформы, если я правильно понял, можно достать с помощью шаблонов вида Шаблон:гл ru 4c. При этом для каждого способа склонения слов создан отдельный шаблон, который уже проверен временем и в будущем вряд ли подвергнется существенным изменениям (имею в виду ту часть, которая отвечает за таблички словоформ)?
  3. Если делать редирект, то при этом имеет ли смысл все равно добавлять шаблон вида Словоформа? Ведь как правило при редиректе результат этого шаблона никто не увидит (разве что только в случае если пользователь попробует зайти на страницу словоформы, отключив редирект)
  4. Имеет смысл создать 100%-ные редиректные словоформные статьи с помощью бота? (естественно очень тщательно и многократно проверив его и получив одобрение, перед запуском глобального процесса)
Забыл подписаться: --Vitalik7 (обсуждение) 18:27, 17 ноября 2013 (UTC)Ответить[ответить]
  • В индексе со словоформами пока не вижу смысла. --Infovarius (обсуждение) 17:34, 17 ноября 2013 (UTC)Ответить[ответить]
    Дело в том, что нашел несколько хороших словарей со словоформами и подумал, что для них тоже можно найти место в нашем Викисловаре.
    К тому же, раз уж все словоформы постепенно и так появятся в Викисловаре, то почему бы им точно также не быть и в Индексе, который будет зависеть от содержимого викисловаря? --Vitalik7 (обсуждение) 18:03, 17 ноября 2013 (UTC)Ответить[ответить]
Моё личное мнение: словоформы в качестве редиректов в Викисловаре необходимы. Я за то, чтобы создать их ботом. Нужно только помнить, что если "словарный вход" уже существует, то статью-редирект делать нельзя. Кроме того, следует учитывать то, о чём я написал выше. Шаблоны при редиректе прописывают категорию для словоформ. Значит, они нужны, но реализация этого ботом для меня, например, была проблематична. --- Vesailok 20:11, 17 ноября 2013 (UTC)Ответить[ответить]
Можно и так: добавить категорию [[::Категория:Словоформы/ru]], [[::Категория:Формы существительных/ru]] и т.д. --- Vesailok 20:22, 17 ноября 2013 (UTC)Ответить[ответить]
Всё это давно написано в правиле ВС:ПН. Создавать миллионы словоформ ботом на данном этапе преждевременно. Don Rumata 07:53, 18 ноября 2013 (UTC)Ответить[ответить]
Дон, не путайте нас. Речь идёт только о редиректах, а не о полноценных статьях. Тот факт, что мы не договорились о приоритетах, не означает, что редиректы нельзя создавать. --- Vesailok 11:34, 18 ноября 2013 (UTC)Ответить[ответить]
Поддерживаю За
В ВС:ПН сказано лишь то, что это не является приоритетной или первоочередной задачей, но тем не менее остается задачей.
Все мы свободные пользователи вики-пространства и вольны выбирать подходящие для нас задачи там, где можем принести бóльшую пользу (главное, чтобы, при этом, конечно, не нарушались принципы соответствующего вики-пространства). Если кто-то может помочь в менее приоритетной задаче, зачем запрещать ему это делать? Так можно несколько лет ожидать пока этот "приоритет" настанет..
Если есть какие-то неопределённые или неутверждённые моменты касательно словоформ — это может быть достаточным аргументом, чтобы не торопиться (но тогда надо просто обсудить эти моменты). Если же всё определено и ясно, то зачем откладывать на потом? К тому же, при необходимости это всегда можно будет с помощью бота изменить (если появятся какие-то новые идеи или требования). --Vitalik7 (обсуждение) 12:24, 18 ноября 2013 (UTC)Ответить[ответить]
  • Я не возражаю против массового создания однозначных перенаправлений, но нужно действовать аккуратно и не создавать перенаправлений с неоднозначных омоформ. Каким образом будет сформирован заливочный список? Как будут отсеиваться омоформы? Я также не против отдельного индекса, если он для чего-нибудь будет полезен.--Cinemantique (обсуждение) 13:49, 18 ноября 2013 (UTC)Ответить[ответить]
    Кратко по поводу того, как это можно реализовать.
    1. Загружается полный список слов Викисловаря
    2. Для слов, у которых прописаны шаблоны вида {{гл ru 4c}}, формируется список их словоформ (правила формирования четко и строго регламентированы конкретным шаблоном).
    3. Если среди полученных словоформ или уже имеющихся слов есть пересечения, то такие слова претендуют на создание отдельной статьи (омонимичные конструкции). Для начала можно составить полный список таких кандидатов.
    4. Для всех уникальных словоформ создаются страницы с редиректами и с шаблонами типа Словоформа, указывающими способ образования словоформы и базовое слово.
    Технически все возможно, но с формированием списка словоформ на основании шаблонов придется повозиться. Может быть получится заняться этим (среди всего прочего) в декабре. --Vitalik7 (обсуждение) 14:30, 18 ноября 2013 (UTC)Ответить[ответить]
  • Боюсь, наличие шаблона на странице будет препятствовать действию редиректа (перенаправление не осуществится). Нужно ставить категорию, скорее всего.--Cinemantique (обсуждение) 14:43, 18 ноября 2013 (UTC)Ответить[ответить]
    Ок, хорошо, с категорией даже проще будет --Vitalik7 (обсуждение) 14:47, 18 ноября 2013 (UTC)Ответить[ответить]
    Абсолютно поддерживаю план, саи такой в голове держу. Единственное, что может сдерживать (и возможно один из аргументов Руматы) - у многих слов не заполнены указанные шаблоны, а значит их не получится разложить на словоформы. Впрочем, это не препятствие - можно регулярно проверять: у какого слова появился шаблон - разложить на словоформы. P.S. Шаблон не мешает перенаправлению, если он стоит после ключевого слова REDIRECT: азартного. При этом шаблон считаю предпочтительнее категорий, т.к. можно указать много дополнительной информации и категории формируются автоматически. --Infovarius (обсуждение) 17:53, 18 ноября 2013 (UTC)Ответить[ответить]
    Что-то я в ВС:ЛК не наблюдаю в задачах Викисловаря создание миллионов перенаправлений для форм слов. Может лучше пока поиграться с формами слов в каком-нибудь другом проекте. Задача словаря в первую очередь дать толкование. Пока даже не все лексемы русского языка описаны, не говоря об украинских или английских. Куда не ткну сплошные болванки, которые насоздавали ботами. Don Rumata 21:04, 18 ноября 2013 (UTC)Ответить[ответить]
    1) словоформа не является лексической единицей? 2) английский и французский раздел создали не то что редиректы, а даже статьи по всем словоформам, и не парятся. 3) между прочим, это удобно - когда будут созданы редиректы, можете просто окружать скобками слово в тексте: насоздавали :) --Infovarius (обсуждение) 12:57, 19 ноября 2013 (UTC)Ответить[ответить]
    Я не понимаю, как предлагаемая работа может ухудшить существующие болванки. И сравнение не совсем корректно: залитые болванки требуют улучшения, в то время как редиректы вроде бы в улучшении не нуждаются. Вы хотите сказать, что нам нужно заставить направить участника Vitalik7 к более приоритетной работе? Но, может быть, он её делать не хочет или не может. (Вы же, Дон, не хотите делать категоризацию по морфемам, и я не знаю, как вас направить к этому.) А среди участников крайне желательно иметь не только тех, кто добавляет толкования, но и программистов, дизайнеров (здесь на память приходят стихи Михалкова).--Cinemantique (обсуждение) 15:33, 19 ноября 2013 (UTC)Ответить[ответить]
    Давайте вы на моей СО напишите, как вы предлагаете делать категоризацию по морфемам, и я сделаю прямо сейчас. Мне не трудно. Я никого ни к чему не понуждаю. Просто я знаю реакцию читателей, когда они приходят на болванку. Да вы и сами наверно видите, какие в этом случае оставляют комментарии. Писать толкование, искать примеры, это работа. А включить бота и создать им миллион редиректов никакой работы не требует. И никакой пользы для читателя в этом нет. Наверно вы знаете, что когда вы набираете слово в строке поиска Викисловаря, то происходит быстрый поиск не только по статьям, но и по редиректам. И вместо десяти лексем в выпадающем списке вы получите десять словоформ одного слова. Don Rumata 16:26, 19 ноября 2013 (UTC)Ответить[ответить]
    Нужно признать это явление либо абсолютным злом и запретить, удалить, либо нужным и полезным — тогда почему не залить? Разве здесь дано третье? То есть такое: пусть некоторые редакторы время от времени создают вручную такие редиректы (замечу, тратя своё время, которое можно было направить на болванки и новые статьи) или на них заменяются статьи, созданные по ошибке случайными редакторами, но залить всё и сразу — ни-ни. Как-то странно. Проблема словоформ в поиске действительно имеется. Возможно ли как-то решить её через настройки (не показывать перенаправления)? Польза, наверное, есть для тех, кто ищет слово по форме, не зная словарную. Да, можно обнаружить в результатах поиска, но так быстрее.--Cinemantique (обсуждение) 16:58, 19 ноября 2013 (UTC)Ответить[ответить]
    Небольшое, но важное замечание касательно поиска. Попробуйте, например, какие варианты предлагаются во всплывающем списке при последовательном вводе букв слова "азартного" в строку поиска. Ни одна из словоформ не попадает в результат выдачи до тех пор, пока не будет введено "азартно". Мало того, слово "азартного" появляется только при вводе "азартног". Аналогичная ситуация и с другими редиректами-словоформами, например, для "Абхазия" или "абитуриентка". Словоформы-редиректы начинают появляться в выдаче только в самый последний момент. И никаким образом не мешают и не путают пользователя. Наоборот: помогают быстрее найти нужное слово, если мы вводим словоформу (например, скопировали в буфер обмена из какого-нибудь сайта и хотим быстро найти его в Викисловаре)
    Для информации, страниц-редиректов на данный момент в Викисловаре более ста тысяч и абсолютное большинство из них — словоформы. Абсолютно согласен с Cinemantique, создавать все эти редиректы — это ведь титанический труд, зачем его продолжать делать вручную, если можно поручить боту?
    "А включить бота и создать им миллион редиректов никакой работы не требует" — а вот такое очень обидно услышать. Позвольте с вами в корне не согласиться. Не знаю, почему у вас такой зуб на программистов, но их работа, поверьте, тоже весьма и весьма не простая. Одно дело — запустить уже готовый, кем-то написанный бот, и сооовсем другое дело — написать этого бота самому, да еще и чтобы другие могли его использовать. --Vitalik7 (обсуждение) 18:19, 19 ноября 2013 (UTC)Ответить[ответить]

Снова про слоги править

  • шаблон считаю предпочтительнее — тогда желательно, чтобы бот и заполнял эту информацию. И нужно определиться с необходимыми полями (слогоделение вроде бы не нужно).--Cinemantique (обсуждение) 15:38, 19 ноября 2013 (UTC)Ответить[ответить]
    Я считаю, чем полнее информация тем лучше. Это делает данные о слове наиболее полными, и всю её потом можно будет использовать. Думаете, роботы не хотят знать, как произносится слово в другом падеже и как его словоделить? :) --Infovarius (обсуждение) 07:20, 21 ноября 2013 (UTC)Ответить[ответить]
    Тогда мне интересно, как бот будет это делать (делить на слоги). ;)--Cinemantique (обсуждение) 08:28, 21 ноября 2013 (UTC)Ответить[ответить]
    Гм.. Я уж было начал писать большое сообщение, что это действительно очень сложная задача и т.п.. А потом задумался, а такая ли она неподъемная.. В принципе ударения уже будут расставлены на основании словообразовательных шаблонов, боту же останется только определить, где нужно разбить слово на слоги (при этом у него уже будет информация о разбиении на слоги базового слова). Тут, конечно, тоже есть ряд подводных камней и этот вопрос нужно исследовать очень тщательно. Но может быть все окажется не так уж и сложно? И принципы словоделения не так уж и запутанны? Например, если в простом виде, то «каждый слог содержит ровно одну гласную, и может заканчивается либо на гласную (аоеент), либо если подряд идет несколько согласных, то захватывает все, кроме последней (вок-зал, а-зарт-но-го)». Я отдаю себе отчет, что сейчас очень сильно упростил задачу и не учел много разных случаев и поэтому был бы благодарен за любую информацию по этому поводу. Если получится реализовать это словоделение для словоформ, то такой же принцип, наверное, можно будет попробовать применить и для автоматизированного добавления словоделений в основные статьи с помощью бота, как вы думаете? --Vitalik7 (обсуждение) 09:56, 21 ноября 2013 (UTC)Ответить[ответить]
    Здесь для меня встаёт проблема «трёх сестёр»: слово можно разбить для переноса тремя равнодопустимыми способами (се-стра, сес-тра, сест-ра). Что касается собственно слогоделения, то его принципы здесь мало кому известны и мало кем соблюдаются (верен только один способ — се-стра, но кон-тракт), а для бота делить на слоги — это, по-моему, невыполнимая задача. Подробности по указанным ссылкам.--Cinemantique (обсуждение) 11:44, 21 ноября 2013 (UTC)Ответить[ответить]
    Спасибо большое за ссылки! Как интересно все получается. Много из школы вспомнилось. Задача действительно не такая простая, как могло показаться сначала..
    По поводу трех сестёр, мне кажется раз возможны три варианта деления, то логично было бы все эти три возможных варианта в Викисловаре и указывать, как считаете?
    По поводу невыполнимости задачи.. Если делать ее полностью автоматической — то да, это весьма и весьма сложная задача, ибо бот должен стать слишком интеллектуальным, он по сути должен уметь правильно предполагать деление слова на морфемы, а это часто может быть слишком непросто.. Но что если сделать ее просто автоматизированной? Т.е. бот может предложить для списка слов свои варианты разделения на слоги. Человек может пройтись по этому списку, вычитать его и (если алгоритм получится хороший) большую часть одобрить, а некоторые исправить. После этого бот автоматически заносит все предложенные и исправленные варианты в словарные статьи. Это будет гораздо быстрее, чем добавлять слогоделение в каждую статью по отдельности. К тому же бот поможет найти все слова без слогоделения, чтобы легче с ними было разобраться.
    В дальнейшем можно будет подумать над похожими механизмами некоторой "автоматизированной помощи" и для других разделов..
    Что скажете? :) --Vitalik7 (обсуждение) 12:25, 21 ноября 2013 (UTC)Ответить[ответить]
    Мне тут видится громадная вычитка, которую никто не захочет делать. Но она и не потребуется, если мы решим вопрос о назначении шаблона «по-слогам» в пользу переносов с необходимостью указания всех вариантов. А для построения всех вариантов переноса слова существуют специальные алгоритмы. Я, к сожалению, не знаю, где их брать и как применять; надо у Дона Руматы спросить или погуглить. Скажите, а с заполнением остальных параметров бот справится?--Cinemantique (обсуждение) 12:45, 21 ноября 2013 (UTC)Ответить[ответить]
    Слава этих алгоритмов несколько преувеличенна: они основаны не более чем на компактной записи эталонного словаря переносов и их качество словарем полностью определяется. Для слов вне такого словаря результат может оказаться плохим. А сам шаблон, несомненно, надо переименовать в "переносы" и не бояться чего-то типа "цар-ст-во". --M. G. J. (обсуждение) 13:21, 21 ноября 2013 (UTC)Ответить[ответить]
    Может, так: ца-[рст]-во? Последовательность в скобках, а также любая её часть может быть отнесена как влево, так и вправо. Потребуется дополнительная инструкция. А что вы думаете о переносе этой информации в отдельный раздел?--Cinemantique (обсуждение) 14:38, 24 ноября 2013 (UTC)Ответить[ответить]
    Тоже вариант. Но, кажется, он с одной стороны переусложненный (из-за скобок), а с другой -- смешивает "хорошие" и "плохие" переносы в кучу. Вот нарисовать бы такую шоколадку с заготовками для деления на кусочки:
             +---+--   -       -   --+---+
             |      \_/ \  /\_/ \ /      |
             | ц   а   р |/с   т | в   о |
             |           |               |
             +---+---+---+---+---+---+---+
  • (типа: чем лучше перенос, тем глубже надрез). ;-) --M. G. J. (обсуждение) 15:04, 24 ноября 2013 (UTC)Ответить[ответить]
    А касательно отдельного раздела -- сейчас эта информация воспринимается не как часть раздела, а скорее как заголовок, которых хочется видеть покрупнее и над всеми разделами. С заголовками для омонимов идеально совмещается. -- M. G. J. (обсуждение) 15:11, 24 ноября 2013 (UTC)Ответить[ответить]
    Ох, не хотелось бы мне такую «шоколадку» в статье увидеть, да ещё в морфологии. :) С точки зрения современных рекомендаций, эти переносы равнодопустимы, но менее предпочтительны варианты с разбитой приставкой и переносом на месте дефиса. А зачем видеть словопереносы покрупнее, неужели они жизненно необходимы? Заголовок есть у статьи. Вот ударение разве что. Особенно у глаголов, не имеющих инфинитива в таблице.--Cinemantique (обсуждение) 15:24, 24 ноября 2013 (UTC)Ответить[ответить]
    Заголовок у статьи -- он где-то там высоко-высоко, часто уже и не на экране. А хотелось бы видеть обсуждаемое слово рядом с началом текста словарной статьи. И переносы дешевле всего иметь прямо проставленными на самом этом слове, а не вынесенными куда-то в какие-то отдельные подразделы. (А тогда эти подразделы в массе своей вообще будут не нужны, если только в переносах нет особенностей, которые надо оговорить отдельно.) В общем, предложение такое: после заголовка первого уровня ("русский язык") всегда (а не только при наличии омономов) ставить заголовок второго уровня, в котором прописывать слово с ударением и переносами. А дальше уже всю морфологою-фонетику-семантику и прочее. Переносы же указывать, наверное, не дефисами (чтобы не путать с дефисами в составе слова), а точечками: ге⋅не⋅ра̀л-гу⋅бер⋅на́⋅тор. --M. G. J. (обсуждение) 10:26, 27 ноября 2013 (UTC)Ответить[ответить]
    А у меня содержание в свёрнутом состоянии, и поэтому заголовок почти всегда под носом. Тут видятся вот какие проблемы: 1) такие заголовки будут странно смотреться в содержании (у тех, кто его не свернул); 2) у омонимов ставится ударение, когда оно разграничивает их; если ударение будет всегда и везде, то такое разграничение сделать не получится. И опять-таки: мне не нравится безальтернативность переноса. Как будет решаться «проблема трёх сестёр»?--Cinemantique (обсуждение) 10:43, 27 ноября 2013 (UTC)Ответить[ответить]
    И даже у вас он под носом только для самого верхнего значения в самом верхнем языке. На 1): можно оформить не как HTML-/wiki-заголовок, а как абзац текста, выглядящий похоже на заголовок (шрифт крупнее, чем у подзаголовков нижних уровней). На безальтернативность: се⋅с⋅т⋅ра̀. --M. G. J. (обсуждение) 11:05, 27 ноября 2013 (UTC)Ответить[ответить]
    Не уверен пока насчёт заголовка, но вариант записи считаю приемлемым. То есть читается так: в любом месте, где стоит точка можно сделать перенос. Можно ещё точки по-разному выделять как нежелательное (красным?). Согласен также насчёт отказа от чёрточки в пользу чего-то другого (точки, например, или палки с разрывом), она мешает в словах с дефисом.--Cinemantique (обсуждение) 11:31, 27 ноября 2013 (UTC)Ответить[ответить]
    се⋅ст⋅ра́-хо⋅зя́й⋅ка? -- M. G. J. (обсуждение) 12:55, 27 ноября 2013 (UTC)Ответить[ответить]
    В руководствах такие случаи не упоминаются, но лучше предупредить, наверное. Даже так: се⋅ст⋅ра́-хо⋅зя́й⋅ка, поскольку рекомендуется избегать переносов на месте дефиса.--Cinemantique (обсуждение) 13:05, 27 ноября 2013 (UTC)Ответить[ответить]
    Тогда уж так: се⋅ст⋅ра́-хо⋅зя́й⋅ка. (Впрочем, тут как раз дефис отмечать не надо было: это не абсолютно запрещенный перенос, как в "они-с едут 1-м классом".) -- M. G. J. (обсуждение) 13:24, 27 ноября 2013 (UTC)Ответить[ответить]
    С заполнением остальных параметров бот справится? — если речь о род, число, падеж и прочее, то да, должен справиться. Это, правда, будет довольно непросто изучить все шаблоны словоизменений и соответствующие для словоформ, но я постараюсь.
    Мне тут видится громадная вычитка, которую никто не захочет делать. — а мне казалось, что один раз вычитать — это гораздо проще и быстрее, чем для каждого отдельного слова потом задумываться. При чем эту "вычитку" можно делать по частям, сколько получилось, столько и одобрить, потом другой человек тоже еще какую-то часть проверит, и потом еще. И так в итоге покрыть со временем все слова.
    Слава этих алгоритмов несколько преувеличенна — а можете дать ссылки на них для изучения? Если есть словарь переносов, то может и бот сможет им в каких-то случаях воспользоваться? --Vitalik7 (обсуждение) 18:22, 22 ноября 2013 (UTC)Ответить[ответить]
    Алгоритм тут: http://tug.org/docs/liang/ Исходные словари переносов где искать -- заранее не знаю, но подготовленные из них базы данных для алгоритма, например, тут: http://www.tex.ac.uk/CTAN/languages/hyphenation/ruhyphen/ (обратно по базе восстановить исходный словарь нельзя). --M. G. J. (обсуждение) 20:21, 22 ноября 2013 (UTC)Ответить[ответить]
    Спасибо! Правда, к сожалению, малопонятно.. Кстати, а о каком таком вопросе о назначении шаблона «по-слогам» шла речь выше? --Vitalik7 (обсуждение) 22:01, 22 ноября 2013 (UTC)Ответить[ответить]
    Речь шла о том, чтобы вместо не вполне понятных "слогов" (то ли фонетических, то ли орфографических) использовать этот (или переименованный) шаблон исключительно для указания мест возможных переносов. --M. G. J. (обсуждение) 14:30, 23 ноября 2013 (UTC)Ответить[ответить]

┌───────────────────────────────────────┘
Мы же вроде решили, что {{по-слогам}} используется только для деления по слогам, а не для переносов. Обсуждали несколько раз. Викисловарь:Лингвистические и лексикографические вопросы/2011#Деление по слогам или правила переноса слов, Викисловарь:Лингвистические и лексикографические вопросы/2012#Слоги в транскрипции, Викисловарь:Организационные вопросы#Слогоделение. Пора это внести в ВС:ПОС. Только нужно определиться, какую теорию слогоделения принять за основную. Don Rumata 21:05, 23 ноября 2013 (UTC)Ответить[ответить]

Прочитал. Видно, что ничего не решили, а вопрос так и висит. Более внятные аргументы в пользу того, чтобы фонетическое деление указывать в транскрипции, а тут — переносы. --M. G. J. (обсуждение) 21:34, 23 ноября 2013 (UTC)Ответить[ответить]
P. S. Про алгоритм Христова, кстати, полная ерунда. Он был в свое время сделан по бедности и в приличной издательской деятельности не используется. А в приличных системах стоит алгоритм Ляна, на который ссылка была выше. И для которого нужны эталонные словари переносов. Поэтому (раз мы тут словарь и составляем) переносы надо ставить вручную. Никакой алгоритм 100%-но правильно в неологизмах переносы не поставит. Условно говоря, надо уметь разбираться, где "био-вал", а где "би-овал" . --M. G. J. (обсуждение) 21:34, 23 ноября 2013 (UTC)Ответить[ответить]
В слове би-о-вал три слога. Don Rumata 07:19, 28 ноября 2013 (UTC)Ответить[ответить]
Речь не про них, а про перенос. -- M. G. J. (обсуждение) 07:52, 28 ноября 2013 (UTC)Ответить[ответить]
Шаблон называется {{по-слогам}}. Фраза «границы слогов, не подходящие к разделению слова, указываются с помощью точки» на странице документации не значит, что шаблон предназначен для указания переносов. В своё время никто не удосужился об этом написать в ВС:ПОС. Все мои попытки хоть как-то выработать консенсус по использованию этого шаблона потонули в дебатах о выборе предпочтительной теории слогоделения. Это очень важный вопрос, но это не значит, что шаблон {{по-слогам}} нужно использовать для указания орфографически правильных переносов. Правила переносов намного проще чем правила выделения границ слога. Если бы мы хотели использовать шаблон для указания переносов, то давно бы так и сделали. Don Rumata 08:46, 28 ноября 2013 (UTC)Ответить[ответить]
Речь не про шаблоны. Не про слоги. А про перенос как таковой. Что это не техническая мелочь, которую можно свалить на какие-то алгоритмы, а важная словарная информация. Связанная и с произношением, и с морфологией, и с семантикой, и даже с психологией-эргономикой. -- M. G. J. (обсуждение) 08:59, 28 ноября 2013 (UTC)Ответить[ответить]
Почитал Обсуждение шаблона:по-слогам. Первоначально его создал аноним, который им задумывался для переноса по слогам. Уж не знаю как так получилось, но указание деления слова есть и в других разделах Викисловаря. Немцы указывают перенос слов в отдельном разделе "Worttrennung". Французы указывают деление на слоги в транскрипции используя знаки МФА. В некоторых языках есть особые правила переноса. В том же немецком есть устаревший вариант переноса de:Zucker → Zuk-//ker, в нидерландском nl:reëel → re-//eel. Всё оформление статьи у нас универсально. Сейчас у нас в разделе «Морфологические и синтаксические свойства» указывается лемматизированная форма слова. Её оформление производится внутри морфологических шаблонов. Кто решил использовать параметр слоги= я не знаю. Что делать если лемматизированная форма и перенос различаются, как в нидерландском, я не знаю. Don Rumata 10:21, 28 ноября 2013 (UTC)Ответить[ответить]

Шаблоны словоизменений править

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.


|ПричСтрад  = —<!--{{qif|test={{{НП|}}}|then=-|else={{{основа}}}и́мый}}-->
В строках такого вида всё, что находится между "<!--" и "-->" является комментарием и может быть проигнорировано, верно? --Vitalik7 (обсуждение) 21:54, 24 ноября 2013 (UTC)Ответить[ответить]
  • Правильно ли я понимаю смысл этого кусочка: {{{основа1|{{{основа}}}}}} — попробовать вставить значение параметра "основа1", а если его нету (он пуст), то тогда использовать параметр "основа"? --Vitalik7 (обсуждение) 23:43, 24 ноября 2013 (UTC)Ответить[ответить]
    • Вероятно, вам будет полезны страницы: w:Википедия:Механизм шаблонов и w:Википедия:Функции парсера.--Cinemantique (обсуждение) 08:35, 25 ноября 2013 (UTC)Ответить[ответить]
    • Да, вы правильно понимаете. Но я бы не стал получать список форм слова из внутренностей шаблона словоизменения, легче из готового html-текста, мне кажется. --Infovarius (обсуждение) 11:15, 25 ноября 2013 (UTC)Ответить[ответить]
      Гм.. Момент спорный.. Если брать готовый html-текст шаблонов, то там не видны будут детали принятия того или иного решения (встречаются #if).
      Если же брать готовые html-тексты всех словарных статей, то мне тут видится две трудности:
      1. Объем вики-текстов для русских слов уже получился где-то 800Мб, а для всех языков 1,3Гб. Если же попытаться загрузить html-тексты (которые значительно превышают по объему wiki-текст), то общий объем возрастет в несколько раз.
        К тому же, загружать вики-тексты можно с помощью удобной библиотеки pywikibot (это уже проделано, и все вики-тексты теперь хранятся в локальной БД, по которой можно легче производить поиск), а html-страницы пришлось бы парсить и загружать вручную.
      2. Парсить html будет гораздо сложнее, чем компактный строго-структурированный вики-текст. Для html-варианта надо будет идентифицировать подходящий языковой раздел (по заголовку), идентифицировать соответствующую таблицу словоизменений, идентифицировать использованные строки в этой таблице и прочее. Также не так просто будет определять некоторые параметры базового слова.
        Для вики-текстов есть правда другие трудности (надо тщательно изучить шаблоны), но зато подход получается более надежный и универсальный. Если обработать все шаблоны (в полу-автоматическом режиме), то будет безошибочный алгоритм по образованию словоформ. Трудность как раз в этой обработке..
      Что в результате окажется проще — это пока еще вопрос открытый, но т.к. я уже начал действовать по варианту с вики-текстами, то постараюсь пока с ним и продолжить..
      А вообще задача оказалась несколько сложнее, чем я думал. Количество шаблонов словоизменения многие и многие сотни (только лишь для глаголов их уже более 500) и они, к сожалению, не все так просты и однотипны, как хотелось бы. Встречаются проверки #if, встречаются включения одного словоизменительного шаблона другим, запись столбцов таблицы иногда происходит в разной манере и прочее.. Но задача все равно пока решаемая. Только получается более трудная и требующая бо́льшего времени. --Vitalik7 (обсуждение) 12:55, 25 ноября 2013 (UTC)Ответить[ответить]
      Если вы разберётесь во многих шаблонах словоизменения (читай: станете экспертом), можете по пути их универсализировать - и всем от этого удобнее будет. --Infovarius (обсуждение) 03:54, 26 ноября 2013 (UTC)Ответить[ответить]
      Гм.. А это и правда интересная мысль.. Ведь действительно так выходит, что пока я пишу этот скрипт по считыванию информации из шаблонов словоизменений, мне приходится досконально изучать их общие и отличающиеся черты, а также назначение ключевых параметров.. Но тогда такие вопросы:
      1. Быть может у кого-то уже были какие-то идеи по поводу упрощения или универсализации этих шаблонов, но просто не доходили руки?
      2. Есть ли где-то единая информация по этой классификации Зализняка, а также по использованию и выбиранию этих шаблонов для словарных статей (может какая-нибудь инструкция или общие моменты)? Или пока что каждому, кто захочет их использовать, нужно разобраться самостоятельно и выбирать на свой страх и риск?
      3. В каких границах мне разрешается производить эту самую универсализацию? Можно пробовать делать некритические изменения самостоятельно, а если же есть какое-нибудь немаленькое предложение по изменению, то предлагать здесь и изменять после обсуждения?
      --Vitalik7 (обсуждение) 13:22, 26 ноября 2013 (UTC)Ответить[ответить]
      Об объединении шаблонов лучше предварительно сообщать. В ВС о классификации Зализняка можно прочесть здесь и далее по ссылкам на глаголы и существительные. Более подробно ознакомиться с ней можно во вступительной части «Грамматического словаря русского языка» Зализняка. По моим ощущениям, в упрощении нуждаются глагольные шаблоны; об этом говорил участник soshial, см. Викисловарь:Организационные вопросы#Модификаторы/суффиксы для шаблонов спряжения русского языка.--Cinemantique (обсуждение) 14:14, 26 ноября 2013 (UTC)Ответить[ответить]
      Спасибо большое за ссылки! Словарь Зализняка скачал (ох и много же там информации по этой классификации), сведения в викисловаре по шаблонам словоизменения нашел (только она не везде полная пока получается). обсуждение по глаголам увидел. Загрузился пока предостаточно.. глубокая тема. --Vitalik7 (обсуждение) 18:49, 26 ноября 2013 (UTC)Ответить[ответить]
  • Есть небольшая просьба-предложение. Почему бы не переименовать шаблоны существительных из такого вида {{сущ ru f ina 2b}} и {{сущ ru n a 4a}} в такой: {{сущ ru ж неод 2b}} и {{сущ ru ср одуш 4a}}? Было бы гораздо понятнее и читабельнее (род и одушевленное/неодушевленное писать на русском), ведь часть речи мы на русском пишем, да и все остальные шаблоны тоже. А то эти "f ina" и "n a" сильно сбивают с толку, особенно с последующей классификацией ("a 4a" смешивается в сознании). --Vitalik7 (обсуждение) 19:06, 26 ноября 2013 (UTC)Ответить[ответить]
Можно как у Зализняка: «сущ ru ж 2b», «сущ ru жо 2b», «сущ ru м 2b», «сущ ru мо 2b» (то есть если неодушевлённое, то ничего не добавляем, а если одушевлённое, добавляем «о»). Но я уже привык, и меня не напрягает. Кроме глаголов: все эти СВ, и -ся, и -л. Впрочем, я редко создаю статьи о глаголах, наверно, поэтому…--Cinemantique (обсуждение) 19:14, 26 ноября 2013 (UTC)Ответить[ответить]
(пока писал это сообщение, появилось новое, поэтому размещаю его под новым)
Очень бы хотелось, чтобы все было выдержано в едином стиле. Это я сейчас не как программист говорю (программе абсолютно не важно как шаблон называется), а с человеческой точки зрения, с позиций удобства использования, понятности и красоты записи.
В словаре Зализняка используется обозначение "мо" для "м одуш" и "м" для "м неод", можем поступить так же, но варианты "м одуш", "м неод" хоть и длиннее, но понятнее и красивее.
Аналогичное предложение по поводу глаголов. В словаре Зализняка пометки "св/нсв" идут до знаков классификации, может и мы сделаем так же? Т.е. вместо {{гл ru 2bСВ}} назовем так: {{гл ru св 2b}}. Будет более сходно с именованием шаблонов для существительных. При этом просто {{гл ru 2b}} станет {{гл ru нсв 2b}} (т.е. явно указывать "нсв"; мне, например, не совсем понятно, зачем несовершенный вид считать видом по умолчанию) --Vitalik7 (обсуждение) 19:22, 26 ноября 2013 (UTC)Ответить[ответить]

Еще некоторые мысли уже по поводу самого содержимого шаблонов словоизменения.
В целом можно выделить два противоположных подхода:

  1. Для каждого конкретного случая отдельно прописывать варианты склонения/спряжения
  2. Пытаться находить похожие моменты, объединять шаблоны, делать проверки внутри и прочее

С точки зрения программной обработки всех этих шаблонов первый способ гораздо выгоднее и проще. Также он проще для людей, являющихся составителями и редакторами этих шаблонов (второй способ иногда может быть более труден для понимания, он более сложный в содержимом шаблонов, в нем легче допустить ошибку, труднее сопровождать). В основном для большинства шаблонов применяется именно первый способ, но иногда (довольно редко, но встречается) применяется и второй.
У меня есть предложение повсеместно использовать именно первый вариант. Понимать, сопровождать людям его легче. И автоматически проанализировать скриптами для формирования словоформ также будет гораздо проще.
Если поддерживаете, то я тогда буду избавляться в шаблонах от проверок вида #if (в пользу создания нового шаблона), а также от включения одним словоизменительным шаблоном другого (по моим предварительным наблюдениям это встречается редко; здесь имеется в виду не использование дополнительных служебных шаблонов, а именно включение одного результирующего другим результирующим). На использовании шаблонов для формирования словарной статьи это принципиальным образом никак не отразится. --Vitalik7 (обсуждение) 19:42, 26 ноября 2013 (UTC)Ответить[ответить]

  • Два момента. Систему шаблонов создавал и изначально продумывал Эл Силонов, поэтому необходимо его мнение по системным изменениям. ИМХО, названия и содержимое шаблонов должно стремиться к понятности и универсальности. Во-вторых, если я правильно понял второй подход, он может быть полезен, чтобы указать и использовать преимущества иерархической структуры спряжений и склонений. Т.е., например, {{сущ ru f ina 2b}} должен вызывать {{сущ ru f ina}}, который вызывает {{сущ ru f}}, который основан на базовом {{сущ ru f}}. Тогда, скажем, в первом уже не надо писать "существительное, женского рода, неодушевлённое", т.к. это вставляют классы шаблоны-предки. --Infovarius (обсуждение) 08:43, 27 ноября 2013 (UTC)Ответить[ответить]
    • С точки зрения алгоритма формообразования должно быть не так: базовый шаблон типа {{сущ ru f 1a}}, а поверх него {{сущ ru f ina 1a}} (а то и просто {{сущ ru f 1a|одуш=ina}}). Потому что сложнее всего построить словоформы, а описательные фразы приклеваются совершенно формальным образом. Вот чем отличается "f ina 2b" от "f a 2b"? Только двумя моментами: словом в описании и одной формой в таблице (вин. мн. брать из им. мн. или из род. мн.); поэтому их надо растить из некоего общего предка "f 2b" (в котором формы вин. мн. может не быть вообще). Я в этом духе сейчас пытаюсь делать глагольные шаблоны для старой орфографии, см. {{гл ru-old 1a}} и {{гл ru-old 2a}}. Вообще в идеале шаблон должен быть один для одного языка: если у Зализняка написано "зерно́ с 1*d, ё" -- то чтобы и вызов был не сложнее {{слово/ru|зерно́|с|1*d|ё}}. --M. G. J. (обсуждение) 10:52, 27 ноября 2013 (UTC)Ответить[ответить]


Попробую ответить сразу на два последних сообщения и донести свое видение ситуации.
К шаблонам словоизменения можно подходить с различных сторон:

  1. C точки зрения использования готовых шаблонов:
    1. С точки зрения выбора подходящего шаблона для создания новой словарной статьи (или добавление шаблона в существующую болванку)
      • Тут мне видится, что было бы идеально, если бы именование шаблонов было максимально приближено к написанию, использованному в словаре Зализняка.
        • В этой связи предложение заменить "сущ ru f a 1a" на русскоязычный аналог: "сущ ru ж одуш 1a" (более наглядно и понятно) или "сущ ru жо 1a" (так используется у Зализняка)
        • Аналогично с глаголами: именовать шаблоны в таком стиле: "гл ru св 2b" или "гл ru нсв 2b"
        • Это просто идея, как она будет реализована в итоге не важно, можно и так: "слово/ru|зерно́|с|1*d|ё" (как предложил выше Участник:M. G. J.)
        • Здесь получается важно услышать мнение основателя шаблонов словоизменения Участник:Al Silonov
    2. C точки зрения просмотра исходного вики-текста существующей словарной статьи (с уже использованным шаблоном словоизменения)
      • В принципе все аналогично. Чем более приближенно будет написание к системе Зализняка, тем бо́льшее количество людей смогут без особых проблем использовать эти шаблоны и тем меньшее время будет требоваться для того, чтобы разобраться в них.
    3. С точки зрения просмотра готового результата использования шаблона
      • Тут уже абсолютно все равно, как мы называли и реализовывали шаблоны — конечный результат будет показан пользователю один и тот же.
    • По сути с точки зрения использования шаблонов конечным пользователям абсолютно не важно, как они устроены внутри, главное, чтобы можно было по названию понять, что он значит, а также с наименьшим количеством усилий выбрать подходящий шаблон для нового слова
  2. С точки зрения создания/редактирования шаблонов:
    • Для начала сразу оговорюсь, что абсолютно согласен с очевидной идеей, что конкретные шаблоны словоизменения используют для формирования результата некоторые более базовые шаблоны. Не вполне согласен только лишь с некоторыми идеями реализации этой задумки, но об этом ниже
    1. С точки зрения первичного создания шаблонов
      • По-началу кажется, что удобнее использовать такие возможности формирования шаблонов, как:
        • включение одних шаблонов другими (предложенная выше идея общего предка для "f ina 2b" и "f a 2b", т.к. они слабо отличаются между собой)
        • разнообразные проверки #if внутри шаблонов и выбор подходящего варианта словообразования в зависимости от тех или иных значений определенных параметров
      • Признаюсь, что у меня первой мыслью, когда я открыл словарь Зализняка, был точно такой же подход, однако потом я поменял свое мнение, но об этом ниже
    2. С точки зрения сопровождения шаблонов (добавление/исправление)
      • Предложенная выше идея сильно проигрывает при необходимости что-то исправить в шаблоне потому что:
        • Постороннему человеку, желающему вникнуть в реализацию шаблонов с целью внести некоторое исправление (вдруг где-то ошибка или просто нужно важное нововведение), придется потратить большое время на то, чтобы вникнуть во взаимосвязи и реализацию шаблонов
        • Самому автору шаблонов спустя долгое время (месяцы или годы) также придется потратить немалое время, чтобы вспомнить и вникнуть в детали реализации
        • Наличие связей между результирующими шаблонами делает их более зависимыми. Не так просто становится изменение отдельного шаблона, если теоретически это может затронуть еще ряд других шаблонов
        • Ро́боту построить словоформы на основании таких сложных шаблонов будет весьма и весьма непросто, но об этом напишу подробнее ниже в отдельном подпункте
      • Мне очень нравится текущий вариант реализации шаблонов, когда для каждого отдельного случая отдельно прописываются соответствующие словоформы.
        • Сами словоформы конкретного шаблона при этом никак не зависят от других шаблонов, переменных параметров и прочего
        • Эти словоформы легко увидеть при просмотре исходников шаблона, и легко исправить при необходимости
        • Если будет необходимо получить набор словоформ слова с помощью бота, то с таким подходом сделать это будет довольно не сложно.
      • При этом я, конечно, ничего не имею против текущего же применяющегося подхода, когда все результирующие шаблоны зависят от некоторого (или некоторых) базовых, за счет чего не приходится дублировать многие моменты (кроме словоформ — их, как я написал выше, считаю что дублировать важно и целесообразно)
    3. С точки зрения автоматического использования шаблонов для создания списка словоформ (с помощью бота)
      • Можно выделить несколько разных идей и подходов для решения задачи автоматического получения словоформ для существующих слов:
        1. Автоматический анализ существующих шаблонов, загрузка вики-текстов существующих словарных статей и формирование списка словоформ на основании проделанного анализа шаблонов
          • Собственно это тот подход, который я уже начал реализовывать
          • Он почти полностью совместим с текущим подходом создания шаблонов
            • Исключение составляет несколько случаев, о которых писал выше (кое-где мелькает #if и включение шаблонов), но это происходит крайне редко и можно будет исправить вручную
          • Я очень рассчитываю на этот вариант
        2. Загрузка html-варианта словарных статей, и последующий парсинг с целью вычленения русских заголовков, далее описание параметров базовой формы (из текста получить конкретные значения) далее таблиц словоизменения, далее используемых строк в этой таблице для определения параметров словоформы, ...
          • Подход более тяжелый
            • и с точки зрения загрузки огромнейшего массива данных - веб-страниц
            • и с точки зрения парсинга html-текста (слишком много разнородных данных нужно идентифицировать)
            • плюс при этом мы сильно привязываемся к конкретным текстам при генерации вывода шаблонами и при малейших их изменениях алгоритм будет давать сбои
          • Это всё реализовать теоретически возможно, но в данном случае мне кажется, что "овчинка выделенки не стоит"
          • Реализация, если за нее браться, займет слишком много сил и времени (я не уверен, что займусь)
        3. Возможно есть какие-то автоматические подходы, которые позволяют довольно несложно запустить некоторый шаблон с определенными параметрами и получить его результат
          • Тогда даже со сложной организацией шаблонов можно было бы попробовать частично реализовать предыдущий тяжелый подход
          • При этом загружаем не html-страницы, а wiki-тексты и идентифицировать заголовки, описание и прочее не нужно, а только лишь столбцы результирующей таблицы, что гораздо проще
          • Однако не уверен, что есть такая удобная автоматическая возможность, но могу ошибаться
        4. Если Участник:DonRumata перепишет шаблоны словоизменения на Lua, то возможно появятся еще подходы
          • Однако это явно не произойдет в ближайшее время (слишком много труда по их написанию и по внедрению вместо существующих)
          • А также еще пока совсем не ясно, облегчит ли это задачу получения словоформ для слова с помощью бота

Приношу извинения за большой объем сообщения, но я попытался всесторонне взглянуть на ситуацию, разбил мысли по группам для облегчения восприятия и попробовал найти достаточную аргументацию для разных взглядов/подходов.
Если же кратко, то:

  • именовать шаблоны хотелось бы красиво, однотипно и понятно — (удобно для человека)
  • содержимое шаблонов должно содержать список всех словоформ, без усложнений — (удобно как для человека, так и для бота)

Очень прошу поддержать это обсуждение всеми заинтересованными лицами, а также в итоге принять некоторое решение по этому поводу. Очень не хочется откладывать эту задачу в долгий ящик, когда уже так много сделано --Vitalik7 (обсуждение) 23:35, 27 ноября 2013 (UTC)Ответить[ответить]

    • Считаю, что предложенный подход (лазить внутрь шаблонов и что-то из них извлекать) идейно неправильный. А правильный такой: каждый шаблон словоизменения должен содержать возможность порождать не табличку, а запрошенную словоформу либо информацию о слове. Что-то такое для каких-то шаблонов вроде бы уже делалось (деталей не помню -- тогда этим не интересовался). И тогда на долю скрипта останется чисто механическая работа:
      • выделить из статьи шаблон словоизменения со всеми параметрами;
      • вызвать его с дополнительным параметром "расскажи о слове";
      • если не рассказал -- отмечаем, что то ли с шаблоном, то ли со статьей что-то не в порядке (шаблон старый либо неправильно вызван);
      • если рассказал -- вызываем нужное число раз с дополнительным параметром "выдай такую-то форму";
      • если ответил, что формы нет или она предположительная -- игнорируем; если выдал форму -- складываем ее в базу данных;
      • в конце эту базу анализируем.
    • P. S. И вообще я бы не торопился. Должна быть огромная межъязыковая омонимия (столбы -> столб/ru, столбъ/ru-old; пишу -> писать/ru, писати/uk и т. п.), а в нерусских разделах еще конь не валялся. --M. G. J. (обсуждение) 03:51, 28 ноября 2013 (UTC)Ответить[ответить]
  • Идея очень красивая и интересная. Когда начинал писать это сообщение, хотел сказать что, я пока не нашел ни одного способа программного запуска шаблона с параметрами и получение его результата "на лету", а затем пришла такая мысль: а что если попробовать воспользоваться для этого страницей Служебная:Развёртка_шаблонов. Жаль, что подобный механизм, похоже, в библиотеку pywikibot включен не был и придется делать это самостоятельно. Но хоть так. Если же я ошибаюсь, то был бы признателен за любые указания на этот счет.
    Теперь по самому подходу. Один из недостатков такого подхода — это то, что для каждого слова придется многократно дергать сервер, а это некрасиво. Поэтому я (пока это возможно сделать сравнительно легко) попробую извлечь словоформы из текущего механизма шаблонов словоизменения, а в будущем, если мы все-таки пойдем по предложенному пути развития, тогда попробую подстроиться под эти новые веяния.
    Однако, решение касательно будущего развития шаблонов все равно еще не принято и его нужно сначала всесторонне обсудить. И все-таки что-то с этим сделать в итоге (я прямо настаиваю, т.к. это не одно только мое личное мнение). В текущем некотором небольшом хаосе (каждый делал шаблоны словоизменения как хотел и при этом менять как будто ничего нельзя ибо привыкли) — ничего хорошего нет! (это просто вопль негодования относительно сообщения ниже). --Vitalik7 (обсуждение) 11:06, 29 ноября 2013 (UTC)Ответить[ответить]
    • Гм.. Кстати, если в итоге будет одобрен именно такой путь развития, то очень кстати окажется идея DonRumata с написанием шаблонов словоизменения на Lua, ибо на обычном языке шаблонов это, мне кажется, будет слишком сложно и громоздко (писать, понимать, сопровождать) --Vitalik7 (обсуждение) 17:47, 29 ноября 2013 (UTC)Ответить[ответить]
  • А по поводу огромной межъязыковой омонимии я бы особо не переживал. Всегда будут оставаться какие-то непокрытые языки. Покрыть же их позже — не составит особого труда. Вот вам существующий пример: "души", в статье представлены словоформы от русского и болгарского, но еще нет, например, украинского. Добавить его можно либо без особых проблем вручную, либо с помощью бота, когда он научится получать словоформы на других языках. --Vitalik7 (обсуждение) 18:15, 29 ноября 2013 (UTC)Ответить[ответить]
  • Vitalik7, а какое отношение имеет удобство наших шаблонов для внешних парсеров к проекту? Как нам удобно так и будем делать. Наименования шаблонов устоялись, менять никто не будет. Латинские буквы в названиях русских шаблонов используются для унификации.
    • Именование шаблонов не имеет никакого отношения к внешним парсерам и работе бота. Я специально разбил свои тезисы на группы, чтобы это было ясно. Первая секция (внешнее представление) - это были лишь предложения (для удобства человека), которые высказывал не только я, но и другие участники на этой и соседних страницах. И еще очень досадно, что несмотря на мою попытку разложить все по полочкам, донести свою мысль — у меня, выходит, это сделать не получилось. Вы, почему-то восприняли всё это как будто "шаблоны необходимы для парсера" и ничего другого не увидели. Обидно. --Vitalik7 (обсуждение) 11:27, 28 ноября 2013 (UTC)Ответить[ответить]
      • В виду того, что вы выразили согласие на разработку алгоритма (в секции "Пробная заливка") не имеет ли смысл снова открыть и это обсуждение для редактирования? --Vitalik7 (обсуждение) 09:12, 29 ноября 2013 (UTC)Ответить[ответить]
  • M. G. J., давайте обсуждать насущные проблемы нашего проекта. Эта страница предназначена для обсуждения в рамках проекта Викимедиа. Don Rumata 06:28, 28 ноября 2013 (UTC)Ответить[ответить]

Закрыто. Для того чтобы парсить словарь, бот не нужен. Дальнейшее обсуждение о внесении омоформ ботом можно будет продолжить после создания базы этих омоформ, которой пока нет. Все комментарии инициатора обсуждения о закрытии темы перенесены на его СО.

Перенесено на страницу Обсуждение участника:Vitalik7

Don Rumata 23:16, 4 декабря 2013 (UTC)Ответить[ответить]

Пробная заливка править

Vitalik, а вы можете по вашей базе подготовить список омоформ, и какую оттуда информацию можно извлечь о словоформе (часть речи, число, падеж, род, лицо, время и т. д.)? Для начала можно было сделать пробную заливку, но не редиректов, а статей-дизамбигов. Глядишь, к полулимону подошли бы перед Новым годом.))--Cinemantique (обсуждение) 00:29, 28 ноября 2013 (UTC)Ответить[ответить]

Гм.. Когда я говорил, что много сделано, то не имел в виду, что работа близится к завершению.
Сделано действительно очень много. Во-первых, загрузка всех словарных статей и налаживание автоматического процесса его обновления - всё это заняло много вечеров, помимо крупной задачи приходилось решать ряд сопутствующих технических, хоть сравнительно небольших, но тем не менее требующих времени для решения, а со свободным временем сейчас как раз проблема. Во-вторых, немало времени потрачено на изучение шаблонов словоизменения и произведены первые попытки по анализу и загрузки их содержимого.
Однако, во-первых, продолжать эту работу имеет смысл только если утвердить предложенное решение по поводу хранения словоформ в шаблонах (по сути просто утвердить уже применяемый сейчас повсеместно подход, подогнать немногие отличающиеся шаблоны под этот стандарт, исправить мелкие различия в оформлении шаблонов, связанные с человеческим фактором). Во-вторых, даже в этом случае работа по анализу шаблонов остается весьма значительной, но тут, помимо самого подхода анализа, загрузки и использования (который также нужно еще написать), остаются уже просто более рутинные моменты (надо выделять общие и интересующие нас моменты в шаблонах словоизменений, а также находить соответствия между параметрами в шаблонах словоизменений и параметрами в шаблонах описания словоформ для каждой части речи).
Т.е. всё вполне реально, но работы еще много и требуется время на ее выполнение. Когда будет закончена часть работы, связанная с анализом и разбором шаблонов, можно будет получить список омоформ и извлекать любую информацию о словоформе.
Кстати, забегая немного вперед, у меня небольшой вопрос: считать ли такими "дизамбигами" варианты, когда одно и то же слово одинаково пишется, например, в разных падежах, числах и т.п.? --Vitalik7 (обсуждение) 01:10, 28 ноября 2013 (UTC)Ответить[ответить]
У нас нет статей неоднозначностей. Это не Википедия. Каждая статья в основном пространстве должна быть посвящена слову. Слова́рь — справочная книга, которая содержит слова (или морфемы, слово­со­че­та­ния, идиомы и т. п.), располо­жен­ные в опреде­лён­ном порядке (различ­ном в разных типах словарей), объясняет значения описываемых единиц, дает различную информацию о них или их перевод на другой язык либо сообщает сведения о предметах, обозначаемых ими. Don Rumata 06:38, 28 ноября 2013 (UTC)Ответить[ответить]
У нас нет статей неоднозначностей. Вы ошибаетесь, Румата: классический пример домну, вариации: маня, воронье, иглу. --Infovarius (обсуждение) 10:05, 28 ноября 2013 (UTC)Ответить[ответить]
Сравни Служебная:DisambiguationPages и w:Служебная:DisambiguationPages. Don Rumata 11:44, 28 ноября 2013 (UTC)Ответить[ответить]
Это техническая вещь. Можно и добавить специальные шаблоны в такие "статьи", если в этом смысл появится. --Infovarius (обсуждение) 17:46, 28 ноября 2013 (UTC)Ответить[ответить]
  • Ни каких пробных заливок ботами! Буду банить беспощадно. Речь шла только о создании перенаправлений. Все крупные заливки только после публичного голосования и при безусловной поддержке большинства участников проекта! Don Rumata 06:49, 28 ноября 2013 (UTC)Ответить[ответить]
    • Я думал, что на странице участника можно создавать любые страницы, они ведь никак не влияют на основное пространство. Вы же не могли подумать, что бот будет делать существенные правки в основном пространстве, не будучи опробованным в личном пространстве? Я уже не новичок и песочницей пользоваться умею, и мой бот вроде пока не давал повода в нем усомниться, работал только на моих страницах участника. --Vitalik7 (обсуждение) 08:50, 28 ноября 2013 (UTC)Ответить[ответить]
      Я не понимаю, мы говорим о создании редиректов или о чём? Какие личные страницы? Вы о создании статей для омоформ типа домну? Какой тут бот? Во-первых, формы слов могут совпадать с лемматизированными формами. Во-вторых, есть слова на других языках. Это не тупая заливка статей. Don Rumata 11:44, 28 ноября 2013 (UTC)Ответить[ответить]
      >> Я не понимаю, мы говорим о создании редиректов или о чём? Какие личные страницы? Вы о создании статей для омоформ типа домну?
      Изначально (в предыдущей секции обсуждения) речь шла о редиректах, т.к. их создать проще, и как правильно заметил Участник:Vesailok при необходимости они очень легко потом превращаются в словарные статьи (благодаря тому, что соответствующий шаблон словоформы там уже будет). Однако в этой секции Участник:Cinemantique предложил создать список омоформ (можете называть это как угодно: омоформы, омонимы, неоднозначности, дизамбиги, слова, представленные на разных языках или в разных формах и прочее, суть сообщения от этого не меняется, ведь имелся в виду тот подход, который сейчас используется в ВС). И да, Участник:Infovarius привел выше хороший пример, это словарные статьи типа "домну". Обратите внимание, в первую очередь было предложено создать просто список омоформ (в самом начале сообщения). Далее было предложено показать, какая информация о параметрах словоформы и базового слова может быть извлечена на основании шаблонов для слов из этого списка. После этого было предложено сделать пробную заливку. Естественно, что эта пробная заливка должна сначала опробоваться для какой-нибудь одной омоформы в личной песочнице (пока всё не заработает должным образом), затем можно прогнать-проверить работу алгоритма на всех омоформах, можно для начала это сделать в личном пространстве (т.е. на под-страницах от Участник:Vitalik7, т.е. на страницах в этом пространстве), а уж потом после того, как все будет работать идеально и будет одобрено сообществом — применять массово для основного пространства.
      >> Какой тут бот? Во-первых, формы слов могут совпадать с лемматизированными формами. Во-вторых, есть слова на других языках. Это не тупая заливка статей.
      Возможно у вас превратное мнение о возможностях ботов. Это могут быть не обязательно какие-нибудь простые рутинные операции. По сути любую задачу, которую можно описать формально — можно поручить боту. Он может быть довольно умным, если его должным образом написать. И это очень сильно облегчит человеческий труд, избавит от рутинных задач и позволит сконцентрироваться на более творческих задачах (а работы в ВС просто непочатый край). Могу ответственно заявить, что если решить задачу по извлечению словоформ для слов (с определением их параметров), то сделать и редиректы, и отдельные статьи типа "домну" будет одинаково легко. При этом наличие словарной статьи в ВС (лемматизированная форма или слово на другом языке) может быть останавливающим фактором и такие варианты на первом этапе просто не будут рассматриваться и формироваться в списке. Но на самом деле даже добавление словоформ в существующие статьи, уже содержащие слова или словоформы на других языках, — не будет сильной помехой в этом деле (однако, я об этом не думал пока даже и не упоминать, учитывая ваш страх перед деятельностью ботов, всему свое время, если позволит сообщество).
      Работа бота ≠ тупая заливка статей! Наоборот — очень досадно видеть, что многую рутинную работу сейчас приходится делать вручную, и еще более досадно, что находятся люди, которые не хотят это менять. Странное решение, в век информационных технологий для информационного проекта не использовать возможности автоматизации на полную катушку. --Vitalik7 (обсуждение) 18:39, 28 ноября 2013 (UTC)Ответить[ответить]
      У меня нет никакой боязни ботов. Я сам программист. Просто я знаю как бывает, когда приходит участник не знакомый с реалиями проекта. Создайте для начала список омоформ на одной странице. Просто добавьте в столбик цепочки (омоформа → лемматизированная форма + падеж → вторая лемматизированная форма + падеж). Я проверю существуют ли для них страницы в словаре, и какие проблемы могут возникнуть при их добавлении в существующие статьи. Don Rumata 00:02, 29 ноября 2013 (UTC)Ответить[ответить]
      Отлично! Я очень рад, что вы не возражаете, против попытки реализации этого подхода. Я согласен, что пока новичок в проекте и должен вести себя крайне осторожно и аккуратно. Перед тем как мы сможем получить список омоформ с характеристиками - нужно еще проделать много кропотливой работы по анализу шаблонов, извлечению словоформ и т.п., а также собственно всё это реализовать. Следующим этапом будет генерирование соответствующих шаблонов-словоформ и редиректов, а потом, если все красиво и качественно получится, то даже и статьи для омоформ. Но, конечно, все это будет применено только если будет правильно реализовано, проверено и одобрено сообществом. --Vitalik7 (обсуждение) 01:04, 29 ноября 2013 (UTC)Ответить[ответить]
Думаю, что если создать редиректы на словарную статью тех русских словоформ, которые в принципе существуют в других языках, но пока что не имеют отдельных статей, то впоследствии их можно будет исправить без особых проблем. --- Vesailok 16:52, 28 ноября 2013 (UTC)Ответить[ответить]

Глагольный шаблон править

Как включить в шаблон с непереходным глаголом страдательное причастие настоящее времени (здесь)?--Cinemantique (обсуждение) 14:38, 13 ноября 2013 (UTC)Ответить[ответить]

Вы о слове благодетельствуемый или благодетельствованный? Разве такие есть? — soshial@ 19:27, 13 ноября 2013 (UTC)Ответить[ответить]
благодетельствуемый имеется, согласно словарю Зализняка.--Cinemantique (обсуждение) 02:50, 14 ноября 2013 (UTC)Ответить[ответить]
Хороший вопрос, чёрт возьми! Спасибо. — soshial@ 06:01, 14 ноября 2013 (UTC)Ответить[ответить]
Нет благодетельствованный, есть облагодетельствованный от гл. облагодетельствовать. Don Rumata 11:03, 15 ноября 2013 (UTC)Ответить[ответить]
◆ Я слишком благодетельствован моим государем, чтобы осмелиться в чем-либо ему не усердствовать. А. С. Грибоедов ◆ Не меньше рыдали и благодетельствованные ею; с сожалением вспоминали знавшие ее... Квитка-Основьяненко ◆ Благодетелю от благодетельствованного. Д. В. Давыдов ◆ На все вопросы Ермолова, курьер, который был родом турок, долго хранил упорное молчание; он был окрещен и благодетельствован дядею отца Ермолова. Д. В. Давыдов ◆ ...и был он от покойного моего батюшки всегда благодетельствован... граф А. Р. Воронцов -- M. G. J. (обсуждение) 11:52, 17 ноября 2013 (UTC)Ответить[ответить]
Полагаю, следует считать это ошибкой и дать указание: «Встречается нелитературная форма…», плюс редирект. Или опять делать статью… Так на все ошибки замучаемся статьи делать.--Cinemantique (обсуждение) 13:03, 17 ноября 2013 (UTC)Ответить[ответить]
Нельзя считать ошибкой. Это устаревшая форма, а не просто нелитературная: некогда глагол употреблялся как переходный (см., например, "Словарь рус. яз. XVIII в.", вып. 2). -- M. G. J. (обсуждение) 14:44, 17 ноября 2013 (UTC)Ответить[ответить]
Значит, указать как устаревшую тем же способом (но со статьёй, а не редиректом). В русском языке слишком много устаревших и диалектных вариантов, чтобы перегружать ими таблицу форм.--Cinemantique (обсуждение) 14:54, 17 ноября 2013 (UTC)Ответить[ответить]
Кто сказал "редирект"? Я за то, чтобы никакие причастия не были редиректами к глаголу. А в таблице или в примечании к ней — не столь существенно. -- M. G. J. (обсуждение) 14:59, 17 ноября 2013 (UTC)Ответить[ответить]
В Викисловаре причастия считаются отдельной частью речи и описываются в статьях. Устаревшая форма использовалась в дореформенной орфографии благодѣтельствованный. В современном русском языке глагол благодетельствовать непереходный. Don Rumata 08:02, 18 ноября 2013 (UTC)Ответить[ответить]
Всё так, но и что отсюда следует?
  • Что для причастий пишутся отдельные статьи -- никто не спорит и не спорил.
  • Вопрос в том, надо ли на них в данном особом случае сослаться из статьи про глагол. И если надо -- то где и в какой форме. Можно в таблице (м. б. придется поправить шаблон спряжения, чтобы при нужде в нем порождались и формально запрещенные причастия), а можно из комментария ("существуют также устар. формы страд. прич. наст. вр. благодетельствуемый и прош. вр. благодетельствованный"). Я за комментарий, если что. Тем более что именно так в статьях про непереходные глаголы руководить и управлять упомянуты страдательные причастия руководимый и управляемый.
  • Орфография же вообще упомянута не по делу. Любую форму любого слова можно из старой орфографии перевести в новую и наоборот. Не бывает такого, чтобы по одной орфографии слово существовало, а по другой -- нет.
--M. G. J. (обсуждение) 09:25, 18 ноября 2013 (UTC)Ответить[ответить]
В Викисловаре дореформенная орфография описывается в отдельных статьях и разделах. См. Русский язык (дореформенная орфография). Есть Шаблоны словоизменений/ru-old. Если у вас есть желание, то вы можете заняться созданием шаблонов спряжений глаголов для таких слов. Don Rumata 10:59, 18 ноября 2013 (UTC)Ответить[ответить]
При чем тут орфография? Как в дореформенной благодѣтельствованный было причастием от благодѣтельствовать, так и в нынешней благодетельствованный есть причастие от благодетельствовать. А на транслите blagodetel'stvovannyj есть причастие от blagodetel'stvovat'. Хоть иероглифами пиши, хоть значками IPA, всё то же самое будет. Это запись одних и тех же слов разными средствами. Они в любой записи существуют и соотносятся одинаково. -- M. G. J. (обсуждение) 11:18, 18 ноября 2013 (UTC)Ответить[ответить]
Нет причастия благодетельствованный в современном русском языке, т.к. глагол благодетельствовать непереходный. Вас даже Гугл поправит, если вы такую форму искать будете. Don Rumata 21:18, 18 ноября 2013 (UTC)Ответить[ответить]
На каком языке написаны приведенные ниже фрагменты и какой частью речи является выделенное в них слово, а? ◆ Многим мы бывали благодетельствованы царями российскими. Е. Федоров, «Уральские повести», 1941 г. ◆ Земли, которые занимают убыхи, чепсоны (одно из племен шапсугов) и гусие, благодетельствованы природой, потому что они дают человеку самые разнообразные фрукты, не требуя от людей особых затрат труда. И. Ф. Бларамберг, «Историческое, топографическое, статистическое, этнографическое и военное описание Кавказа» / перевод А. И. Петрова с франц. оригинала 1836 г., 1974 г. // «Адыги, балкарцы и карачаевцы в известиях европейских авторов XIII—XIX вв.» ◆ Достаточно указать на А. П. Сумарокова; по его словам, Петр «старинны грубости искоренял», за что люди, им благодетельствованные, должны были его назвать богом. Л. Н. Пушкарев, «Общественно-политическая мысль России: вторая половина XVII века», 1982 г. ◆ Однако вскоре юношу поманили эполеты, и, будучи благодетельствован некоею «особой», был он зачислен корнетом в Лубенский гусарский полк. М. А. Турьян, «Странная моя судьба (о жизни В. Ф. Одоевского)», 1991 г.
В общем, есть некоторое количество непереходных глаголов, от которых таки образуются страдательные причастия (жирные — явно указаны Зализняком в описаниях соотв. глаголов, прочие взяты из разных трудов по лингвистике): достигнутьдостигнутый, избегнутьизбегнутый, командоватькомандуемый, подёрнутьподёрнутый, предшествоватьпредшествуемый, пренебрегатьпренебрегаемый, пренебречьпренебрежённый, руководитьруководимый, сопутствоватьсопутствуемый, угрожатьугрожаемый, управлятьуправляемый... Тут тот же самый случай, только еще и устар.. --M. G. J. (обсуждение) 09:10, 19 ноября 2013 (UTC)Ответить[ответить]

┌───────────────────────────────────────┘
Коллега, из всех ваших цитат более-менее подходит только первая, но смысл её у меня ускользает. Тут должно быть либо многим мы бывали благодетельствуемы царями, либо многим мы бывали облагодетельствованы царями. Это какой-то авторский окказионализм. Во всех остальных цитатах причастие употребляется явно в совершенном виде. У гл. несов. вида благодетельствовать — «делать благо, благотворить» есть видовая пара гл. сов. вида облагодетельствовать — «сделать благо» и соответственно страд. причастие сов. вида. И то и другое в словарях помечено как устаревшее. По-любому, этот спор может разрешить только указание на авторитетный лингвистический источник. Приведу цитату:

В страдательных причастиях давно уже нарушен параллелизм между формами настоящего и прошедшего времени. А. А. Потебня так охарактеризовал этот процесс: «На свойственной нынешнему языку степени развития категорий совершенности и несовершенности глаголы совершенные не имеют причастия настоящего страдательного (равно как и действительного), вследствие чего мысль языка начинает роднить самое понятие о причастии прошедшем страдательном с совершенностью. Поэтому-то и, наоборот, причастие прошедшее страдательное от глаголов несовершенных более длительных как бы начинает выходить из употребления, по крайней мере в отдельных случаях; можно сказать: был укоряем, упрекаем, обвиняем, распространяем... сберегаем; было приобщаемо, сообщаемо к сведению, но нельзя сказать: был укорян, упрекан, было приобщано» (130).

В современном языке причастия на -нный и -тый от основ несовершенного вида непродуктивны. Живые формы таких причастий немногочисленны: читанный, писанный, надеванный, несенный, тертый, петый и т. п. Основы несовершенного вида на -а, соотносительные с беспредложными основами вида совершенного на -и, не могут образовать такого причастия (ср. невозможность форм вроде: бросанный, покупаемый и т. п., но: брошенный, купленный и т. п.) (131).

В.В. Виноградов «Русский язык»

Честно говоря я не очень понимаю зачем об этом спорить. Don Rumata 12:11, 19 ноября 2013 (UTC)Ответить[ответить]

Вот решение:
Благоде́тельствовать, с т в у ю, с т в у е ш ь, несов., неперех. и перех.
1. Неперех. Оказывать пользу, услуги, покровительство. <...>
2. Перех. устар. Приносить пользу, награждать, одарять чем.

— БАС, т. 1 (1950), стлб. 481.

А -- M. G. J. (обсуждение) 13:04, 19 ноября 2013 (UTC)Ответить[ответить]

Моя точка зрения такова, что раз уж мы описываем язык не только какой он в данный момент, но и какой он был хотя бы двести лет назад (а иначе зачем нам пометы "устар." и "старин."), нужно добавлять устаревшее переходное значение глагола с соответствующими пометами и тогда не будет вопросов как это всё оформлять: всё будет находиться в таблице. Что делать в случаях, когда страдательное причастие вдруг появилось при том, что глагол никогда не был переходным, — не знаю. Возможно, в таких случаях слова можно указать в параметре |коммент=... в шаблону глагола. — soshial@ 13:08, 19 ноября 2013 (UTC)Ответить[ответить]

Я не против, указывайте в примечаниях параметром коммент= устаревшие формы. Только не нужно их добавлять в таблицу. Don Rumata 13:54, 19 ноября 2013 (UTC)Ответить[ответить]

Категория прилагательных править

Заметил, что создаваемые через скрипт статьи о русских прилагательных не включаются в категорию «Русские прилагательные» (байдарный, например).--Cinemantique (обсуждение) 17:10, 12 ноября 2013 (UTC)Ответить[ответить]

Всё дело в том, что {{прил ru 1a}} не помещал в эту категорию. А вы за то, чтобы помещать в родительскую, при том, что статья уже находится в Прилагательные, склонение 1a? Infovarius (обсуждение) 05:51, 13 ноября 2013 (UTC)Ответить[ответить]
Наверное, за. Для чего-нибудь может пригодиться, не знаю. Меня больше беспокоит нахождение словоформ в общей языковой категории, из-за чего нельзя точно сказать, сколько у нас словарных единиц (и провести сравнение с обычными словарями).--Cinemantique (обсуждение) 07:37, 13 ноября 2013 (UTC)Ответить[ответить]
Именно поэтому я не люблю систему категорий в en- и fr-словарях :) Там я до сих пор не могу правильно определить число слов в каждом языке. У нас это хоть возможно, т.к. все слова дублируются в головных категориях типа Русский язык. --Infovarius (обсуждение) 14:07, 13 ноября 2013 (UTC)Ответить[ответить]

Подпись править

Если кого-то очень сильно беспокоит "подпись", нельзя ли включить соответствующий "тег" для автоматической подстановки подписи не только в истории правок, но и при закрытии окна с записью или комментарием в обсуждениях, или -- добавить цветное разделение записей от различных участников? Такие возможности вики-медией предусмотрены.

Полный формат править

Можно ли в заготовку для статей установить полный формат заготовки для морфологии?

{{морфо|прист1=|прист2=|суфф-1=|прист3=|корень1=|суфф-1=|суфф-2=|соед=|прист21=|корень2=|суфф1=|суфф2=|оконч=|частица=}}

Редактирую править

Коллеги, напомните, пожалуйста. У нас есть шаблон "редактирую", который просит временно не вмешиваться в работу над статьёй? -- Andrew Krizhanovsky (обсуждение) 09:04, 11 ноября 2013 (UTC)Ответить[ответить]

Есть, и даже не один, кажется. Точно есть {{занято}} и {{Пишу}}, было что-то еще, но практически это не используется. --Al Silonov (обсуждение) 10:08, 11 ноября 2013 (UTC)Ответить[ответить]
Спасибо большое! Если в течение ближайшего месяца будут появляться словарные статьи с таким шаблоном, то это мои студенты изучают возможности Викисловаря, см. vk точка com/pages?oid=-41102811&p=%D0%92%D0%B8%D0%BA%D0%B8%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C :) -- Andrew Krizhanovsky (обсуждение) 13:00, 11 ноября 2013 (UTC)Ответить[ответить]
Было бы здорово увидеть эти мастер-классы на Ютубе.--Cinemantique (обсуждение) 13:20, 11 ноября 2013 (UTC)Ответить[ответить]
Учту на будущее. Сомневаюсь, что будет красивая картинка, но должно быть познавательно. -- Andrew Krizhanovsky (обсуждение) 18:38, 11 ноября 2013 (UTC)Ответить[ответить]
Крутая идея своих студентов к подобному приучать! — soshial@ 14:16, 11 ноября 2013 (UTC)Ответить[ответить]

Произношение править

Такое аудиовизуальное приложение, как в статье сто, во многих браузерах и компьютерах не работает, а мы претендуем на универсальность для любого желающего воспользоваться словарём. Ранние варианты -- со ссылкой на файл, были более работоспособными.

  • В Opera и Firefox работает, например. Где не работает?--Cinemantique (обсуждение) 17:26, 5 ноября 2013 (UTC)Ответить[ответить]
    • IE
      • У меня в IE 10 при щелчке по той области предложило загрузить и открыть ogg-файл. --Vitalik7 (обсуждение) 22:31, 5 ноября 2013 (UTC)Ответить[ответить]
        • Я вижу безобразную чёрную полосу с невписывающимся по размеру, серым -- возможно треугольником, внутри: при нажатии, требует установить Джаву. Однако, по поводу Джавы есть постоянные предупреждения о возможности внедрения в комп вредоносных программ и шпионажа.
Честно говоря, после внесения этого инструмента внутрь шаблона МФА стало довольно уродливо, и даже работающий вариант (у меня FireFox) неудобен. Субъективно: раньше, с обычным {{медиа}} было лучше. --Al Silonov (обсуждение) 08:03, 6 ноября 2013 (UTC)Ответить[ответить]
У меня через шаблон «медиа» файл проигрывается в новом окне (или, если кликать по картинке, открывается страница на Складе), приходится возвращаться в статью, нажимая кнопку «Назад». Трудно назвать это удобным функционированием.--Cinemantique (обсуждение) 09:43, 11 ноября 2013 (UTC)Ответить[ответить]

Предложения по спискам значков в нижнем меню править

Спецсимволы (основной набор): добавить кавычки « » „ “ и по отдельности.

IPA for Russian: сделать одинаковое двоеточие у ʑ: и ɕː (и ботом перепроверить в статьях).

Кириллица: добавить ударение само по себе (и заодно уж и побочное ударение: ра̀диопереда́ча, еще два ударения для сербского и знак долготы) и ять-фиту-ижицу.

Старославянские буквы: убрать "ѹ/Ѹ" (в уникоде они давно объявлены нежелательными и подлежащими замене на о/О + у; надо бы ботом и из статей вычистить) и "Ҁ" (это вообще не буква и вряд ли где потребуется вне статьи про саму себя). Добавить строчные буквы.

Слав. латиница: добавить югославские надстрочники для гласных (четыре вида ударения и знак долготы). -- M. G. J. (обсуждение) 20:26, 31 октября 2013 (UTC)Ответить[ответить]

Оглавление править

Сейчас в настройках можно ставить птичку на условие "Показывать оглавление (для страниц более чем с 3 заголовками)". Но для словаря это фактически бесполезная опция: даже у самой что ни на есть болванки уже имеется структура с десятком заголовков. Более осмысленный вариант (для основного пространства статей) был бы такой: если на странице есть минимум два заголовка первого уровня (т. е. несколько языков) или минимум два заголовка второго уровня (т. е. есть омонимы), то показывать оглавление с первыми двумя уровнями заголовков, а в противном случае не показывать ничего. -- M. G. J. (обсуждение) 06:39, 31 октября 2013 (UTC)Ответить[ответить]

Шаблон lang править

Появилось несколько вопросов-задач по поводу шаблона {{lang}}. Прошу ознакомиться и высказать мнение.

  1. Для языков с некириллической и нелатинской графикой предлагаю ввести рекомендацию указывать транскрипцию на латинице. Для большинства пользователей иероглифы, арабская вязь и прочее — это абсолютно нечитабельные и с трудом воспринимаемые закорючки. В русских источниках такая традиция вроде бы есть. Надо бы только определиться с используемыми стандартами для разных график. Я думаю, будет правильным располагать эту транскрипцию непосредственно после оригинального написания, а для этого необходимо включить в шаблон дополнительный параметр комментария.
  2. Есть ещё такая традиция: при разложении исходника на составные части не дублировать название языка, если он совпадает с уже указанным. Например,
франц. bœuf braisé < bœuf «говядина» + braiser «жарить на слабом огне».

а не

 франц. bœuf braisé < франц. bœuf «говядина» + франц. braiser «жарить на слабом огне».

Соблюсти этот принцип, используя шаблон во второй части, невозможно. Приходится не использовать его, но в этом случае шрифтовое оформление слов различается, и это не очень красиво.

  1. И последний вопрос разъясню на примере bœuf braisé. Есть некоторые сомнения, что это устойчивое сочетание во французском и, следовательно, о нём может быть создана статья. В подобных случаях хотелось бы отключить простановку вики-ссылки.--Cinemantique (обсуждение) 14:09, 30 октября 2013 (UTC)Ответить[ответить]
  • А почему латинскими буквами (которых всего-то 28), а не русскими, и -- как быть с теми звуками, которых нет ни в латинской и не в русской азбуке: горловое К (Қ с хвостиком), горловое Г (как в белорусском - Ґ, малороссийском, украинском... диалектическом), О с пояском (Ө - йёо), носовые звуки и буквы (как Ң), хрипящие, шипящие, придыхательные, буквы Ə, Ў, Ұ и т.д.?

Шаблоны морфемики править

См. изъять, выплакать. В морфологии окончания названы суффиксами. Weldis (обсуждение) 16:25, 21 октября 2013 (UTC)Ответить[ответить]

Кто-то что-то подправил без консенсуса. "-ть" может рассматриваться и как суффикс в инфинитиве, и как окончание. Надо срочно определяться, что это в нашем словаре. --- Vesailok 17:21, 21 октября 2013 (UTC)Ответить[ответить]
Для начала нужно срочно восстановить, как было.Weldis (обсуждение) 18:17, 21 октября 2013 (UTC)Ответить[ответить]
Кстати, в благодарить всё осталось по-прежнему. Weldis (обсуждение) 18:25, 21 октября 2013 (UTC)Ответить[ответить]
Weldis, пожалуйста, придумывай более содержательные, предметные заголовки в обсуждениях. "Караул" у нас везде, надо конкретнее. --Al Silonov (обсуждение) 20:17, 21 октября 2013 (UTC)Ответить[ответить]

Гипонимы и гиперонимы править

Построил список гипонимов и гиперонимов по данным Русского Викисловаря по дампу от 2013-08-15. https://docs.google.com/file/d/0B5yjAmdZqsqNa0RMWG11LVg0cjg/edit?usp=sharing

Всего пар гипонимов и гиперонимов для существительных: 42108. -- Andrew Krizhanovsky (обсуждение) 21:52, 18 октября 2013 (UTC)Ответить[ответить]

Шаблон словоизменения с квадратными скобками в названии править

Пытаюсь создать шаблон склонения по схеме {{сущ_ru_n_ina_6*a((2))}} для слова верховье (см. starling и Зализняка), однако возникают проблемы с категориями. Просьба помочь. — soshial@ 15:24, 4 октября 2013 (UTC)Ответить[ответить]

Хм, интересно. Похоже, такие категории нельзя создавать. Можно по аналогии с шаблоном две пары круглых поставить. --Infovarius (обсуждение) 17:41, 4 октября 2013 (UTC)Ответить[ответить]

Род аббревиатур править

Коллеги, предлагаю добавить параметр «род» в шаблон {{abbrev}} для отображения в статьях и автоматической категоризации. Есть ли возражения и кто может взяться за реализацию?--Cinemantique (обсуждение) 12:57, 8 сентября 2013 (UTC)Ответить[ответить]

(И кстати, вызывает некоторые сомнения необходимость деления на слоги (то есть для переноса) аббревиатур…)--Cinemantique (обсуждение) 13:02, 8 сентября 2013 (UTC)Ответить[ответить]

Аббревиатура это не только США, КПСС, КА, но и Минобразования, соцкульбыт, военкомат, замглавы и пр. Слоги это не перенос. Don Rumata 22:02, 8 сентября 2013 (UTC)Ответить[ответить]
Думаю, род для аббревиатур не помешает. У АБЫРВАЛГ- род муской, а у ГЛАВРЫБА- род женский. Weldis (обсуждение) 07:21, 9 сентября 2013 (UTC)Ответить[ответить]

Управление списком наблюдения править

Ныне мой список наблюдения содержит 2000 страниц и стало очень трудно им управлять (конечно, подобное число, наверно, не сопоставимо с вашими). Кто-нибудь из вас знает какой-нибудь удобный способ персональной категоризации списка? Не обязательно как модуль mediawiki, можно и в виде javascript'а. Также, было бы очень удобно просматривать изменения по каждому списку отдельно. Спасибо. — soshial@ 20:45, 3 сентября 2013 (UTC)Ответить[ответить]

Не знаю такого способа. У меня пока 7323 страницы, но это никак не напрягает, т.к. в один день изменений очень мало, а все и не смотрю. Don Rumata 06:59, 4 сентября 2013 (UTC)Ответить[ответить]
Более 24 тысяч, полёт нормальный :) Немного тормозит при загрузке, но работать можно, успеваю все просматривать. "Расширенный список наблюдения" и "Управление списком наблюдения" в настройках/гаджетах включены? --Infovarius (обсуждение) 07:40, 4 сентября 2013 (UTC)Ответить[ответить]
"Расширенный список наблюдения" есть, а вот "Управление списком наблюдения" - это под секцией Специальные страницы? Дело не в том, что я не успеваю их проверять, а в том, что хотелось бы иметь несколько списков для различны целей. Ладно, буду пытаться искать что-либо.

Второй вопрос: как сделать так, чтобы вывелись страницы из списка наблюдения, которые ещё ни разу не были патрулированы. И просьба: обновить до последней версии гаджет "Быстрый предпросмотр с помощью Ajax", потому что не работает клавиша "Изменения". — soshial@ 12:00, 4 сентября 2013 (UTC)Ответить[ответить]

Ну если вы хотите различные списки наблюдения, можно сделать так: собрать отдельные списки на отдельные свои подстраницы, и смотреть на "Связанные правки" для каждой (в панели инструментов слева). Непатрулированные из списка наблюдения вроде нельзя получить, а устаревшие - через Special:PendingChanges. --Infovarius (обсуждение) 12:26, 4 сентября 2013 (UTC)Ответить[ответить]

Уточнение морфологии править

У слова белеть необходимо уточнить, что «соответствующий глагол совершенного вида» существует только для первого значения. Как это правильно сделать?--Cinemantique (обсуждение) 15:03, 31 августа 2013 (UTC)Ответить[ответить]

Вот так. Don Rumata 20:06, 31 августа 2013 (UTC)Ответить[ответить]

Столбцы править

Прошу участников, владеющих языком шаблонов, добавить параметр столбцы в шаблон {{книга}}, как это уже было сделано в ВП.--Cinemantique (обсуждение) 09:40, 29 августа 2013 (UTC)Ответить[ответить]

Чуть позже. Я его переписываю на Lua. 20:07, 31 августа 2013 (UTC)

Пометы в толкованиях править

Собрал некоторую статистику по условным сокращениям: Участник:AKA MBG/Статистика:Пометы.

Надеюсь, что в особенности третья табличка ("Labels found by parser") поможет улучшить статьи. Заодно можно обсудить вопрос - стоит ли писать очень длинные пояснения в шаблоне {{помета}}?
P.S. Чтобы отсортировать пометы по длине - кликните на заголовок столбца "Length". -- Andrew Krizhanovsky (обсуждение) 16:09, 20 августа 2013 (UTC)Ответить[ответить]

P.P.S. Наконец получилось извлечь региональные пометы (а именно: параметр шаблона {{рег.}}), см. таблицу Regional_labels, строки с категорией "regional automatic". -- Andrew Krizhanovsky (обсуждение) 10:12, 16 января 2014 (UTC)Ответить[ответить]

Пометы в переводах (правила оформления) править

Сейчас в правилах звучит:

В скобках после слов могут указываться стилевые пометы, например (устар.), ...

Предлагаю изменения (использование шаблонов) в формулировке правил:

Начало формулировки


В скобках после слов могут указываться стилевые пометы, например так:

{{перев-блок|предмет одежды|
|en=[[belt]], [[girdle]] ({{портн.|-}}), [[sash]] ({{комп.|-}}, {{помета|элемент одежды хакера}})
}}

Что будет выглядеть следующим образом:

предмет одежды

Конец формулировки

Тогда будет единое оформление помет в толкованиях, синонимах и переводах.
P.S. Не нравятся мне лишние круглые скобки, но без них не знаю как обойтись: у одного перевода может быть несколько помет (см. "sash" в примере). -- Andrew Krizhanovsky (обсуждение) 13:00, 22 августа 2013 (UTC)Ответить[ответить]

Ох, боюсь я с такими нововведениями никогда не сделаю удобный ввод переводов как у англичан. Don Rumata 16:54, 22 августа 2013 (UTC)Ответить[ответить]
Может, в переводах без шаблонов пометы указывать? Или через единственный {{помета}}. --Infovarius (обсуждение) 12:09, 23 августа 2013 (UTC)Ответить[ответить]
У англичан при добавлении перевода (если раскрыть доп. опции по кнопке "More") есть поле ввода "Qualifier" - это как раз наши условные сокращения. -- Andrew Krizhanovsky (обсуждение) 12:39, 23 августа 2013 (UTC)Ответить[ответить]

Запятая в начале пометы/пояснения править

Написал вопрос там: Запятая в начале пометы/пояснения. -- Andrew Krizhanovsky (обсуждение) 09:38, 9 января 2014 (UTC)Ответить[ответить]

Порядок сортировки в категориях править

Господа, по результатам обсуждения в Википедии w:Википедия:Форум/Технический#Сортировка «Ё»: к походу на багзиллу создан запрос bugzilla:52997 на изменение порядка сортировки согласно правилам русского языка. Прошу вас поддержать указанную инициативу. Don Rumata 05:36, 19 августа 2013 (UTC)Ответить[ответить]

"Поддержать" - это написать что-то в поле "Additional Comments" или есть какая-то кнопочка для голосования? -- Andrew Krizhanovsky (обсуждение) 11:48, 19 августа 2013 (UTC)Ответить[ответить]
Есть — Importance: Normal enhancement with 4 votes (vote)↙. Требуется регистрация.--Cinemantique (обсуждение) 12:35, 19 августа 2013 (UTC)Ответить[ответить]
Там дискутируют программисты, я, к сожалению, их языком не владею. Никто кратко и внятно, в человеческих терминах, не описал существующую ситуацию и предлагаемые варианты. Я не понимаю, что такое "проголосовать внесение в InitialiseSettings.php кода 'ruwiki' => 'uca-ru',". Значит, и поддержать не решусь. --Al Silonov (обсуждение) 12:58, 19 августа 2013 (UTC)Ответить[ответить]
Как выяснилось из недавнего обсуждения на багзилле, в Википедии был одобрен вариант с «Е» и «Ё» вперемежку. Нужно ли это нам? Don Rumata 14:53, 1 сентября 2013 (UTC)Ответить[ответить]
Так на голосовании по ссылке ведь проголосовали за разделение Е от Ё, и за то, чтобы Ё после Е было, разве нет? — soshial@ 14:59, 1 сентября 2013 (UTC)Ответить[ответить]
Ну вот выяснилось, что в алгоритме сортировки uca-ru «Ё» = «Е» и для неё не создаётся отдельной секции. Кстати, действительно, в академических словарях, например в БАС, слова с "Ё" указаны вперемежку и отдельного выделения слов, начинающихся на «Ё», нет. Don Rumata 15:19, 1 сентября 2013 (UTC)Ответить[ответить]
нет, такого нам не надо. Кстати, в крайнем случае - . --Infovarius (обсуждение) 19:17, 1 сентября 2013 (UTC)Ответить[ответить]

Фильтр № 3 править

Хотел на странице «в отличии от» поставить шаблон wrongname вместо перенаправления, однако фильтр не позволяет. Предлагаю подкорректировать его.--Cinemantique (обсуждение) 08:47, 5 августа 2013 (UTC)Ответить[ответить]

Оформление Индекса, составляемого вручную править

Дополнительная информация править

Пример использования шаблона "кол" из википедии

Список, автоматически разбитый на три колонки:

  • Элемент списка 1
  • Элемент списка 2
  • Элемент списка 3
  • Элемент списка 4
  • Элемент списка 5
  • Элемент списка 6
  • Элемент списка 7
  • Элемент списка 8
  • Элемент списка 9
  • Элемент списка 10
  • Элемент списка 11
  • Элемент списка 12
  • Элемент списка 13
  • Элемент списка 14
  • Элемент списка 15
  • Элемент списка 16
  • Элемент списка 17
  • Элемент списка 18
  • Элемент списка 19


Предположительно требуемый фрагмент css
ol.index, div.index ol {
    margin: 0.2em
}
ol.index li, div.index ol li, div.index h3 {
    float: left;
    width: 20em;
    list-style-type: none;
    margin-left: 0;
    margin-right: 0;
    overflow: hidden
}
div.index h3 {
    font-size: 160%;
    width: 12.5em;
    margin-right: 0.2em
}


Общее количество слов в Индексе по буквам
- 67
А 8357
б 9280
в 12972
г 7224
д 8366
ж 1397
з 7740
и 5261
й 85
к 14166
л 4463
м 9674
н 12979
о 12737
п 32479
р 9314
с 18208
Т 7636
у 4462
ф 3778
х 2564
ц 1311
Ч 2278
ш 2788
щ 418
ы 11
э 3148
ю 459
я 861


Количество строк по страницам текущего Индекса
  • "-" - 71
  • Ё - 78
  • А - 971
  • Аб - 383
  • Ав - 957
  • Аг - 356
  • Ад - 366
  • Ак - 580
  • Ал - 897
  • Ам - 418
  • Ан - 1646
  • Ап - 318
  • Ар - 954
  • Ас - 493
  • Ат - 245
  • Аэ - 357
  • Б - 312
  • Ба - 1827
  • Бе - 2731
  • Би - 887
  • Бл - 621
  • Бо - 1314
  • Бр - 929
  • Бу - 1021
  • В - 2311
  • Ва - 1015
  • Ве - 1438
  • Вз - 683
  • Ви - 1207
  • Вн - 407
  • Во - 2328
  • Вс - 683
  • Вы - 3326
  • Г - 353
  • Га - 1173
  • Ге - 1123
  • Ги - 1150
  • Гл - 561
  • Го - 1508
  • Гр - 1174
  • Гу - 511
  • Д - 623
  • Да - 522
  • Дв - 664
  • Де - 2064
  • Ди - 1169
  • До - 2611
  • Др - 577
  • Ду - 515
  • Е - 983
  • Ж - 379
  • Жа - 254
  • Же - 451
  • Жи - 452
  • З - 1032
  • За - 6158
  • Зе - 378
  • Зо - 353
  • И - 1540
  • Из - 1496
  • Ин - 1266
  • Ис - 1152
  • Й - 94
  • К - 689
  • Ка - 3111
  • Кв - 428
  • Ки - 969
  • Кл - 715
  • Ко - 5458
  • Кр - 1839
  • Ку - 1321
  • Л - 730
  • Ла - 880
  • Ле - 1055
  • Ли - 1006
  • Ло - 703
  • Лу - 394
  • М - 555
  • Ма - 2852
  • Ме - 2068
  • Ми - 1613
  • Мн - 507
  • Мо - 1730
  • Му - 696
  • Н - 417
  • На - 5181
  • Не - 5988
  • Ни - 928
  • Но - 771
  • О - 1848
  • Об - 3598
  • Ог - 347
  • Од - 654
  • Ок - 697
  • Оп - 916
  • Ор - 645
  • Ос - 1153
  • От - 3301
  • П - 860
  • Па - 2425
  • Пе - 5127
  • Пи - 933
  • Пл - 1098
  • По - 11913
  • Пр - 9213
  • Пс - 600
  • Пу - 717
  • Р - 298
  • Ра - 5403
  • Ре - 1865
  • Ри - 315
  • Ро - 880
  • Ру - 569
  • Ры - 342
  • С - 261
  • Сё - 39
  • Са - 2091
  • Сб - 220
  • Св - 1248
  • Сг - 151
  • Сд - 146
  • Се - 1825
  • Сж - 62
  • Сз - 11
  • Си - 1198
  • Ск - 1387
  • Сл - 825
  • См - 635
  • Сн - 298
  • Со - 2194
  • Сп - 1114
  • Ср - 335
  • Сс - 100
  • Ст - 2600
  • Су - 1403
  • Сф - 96
  • Сх - 140
  • Сц - 83
  • Сч - 128
  • Сш - 41
  • Съ - 65
  • Сы - 237
  • Сь - 7
  • Сэ - 31
  • Сю - 58
  • Ся - 32
  • Т - 741
  • Та - 1064
  • Те - 1887
  • Ти - 502
  • То - 1181
  • Тр - 1915
  • Ту - 686
  • У - 1126
  • Ув - 283
  • Уг - 322
  • Уд - 307
  • Ук - 305
  • Ул - 314
  • Ум - 385
  • Уп - 384
  • Ур - 337
  • Ус - 614
  • Ут - 455
  • Ф - 377
  • Фа - 728
  • Фе - 525
  • Фи - 760
  • Фл - 320
  • Фо - 961
  • Фр - 359
  • Х - 488
  • Ха - 500
  • Хи - 305
  • Хл - 402
  • Хо - 635
  • Хр - 447
  • Ц - 194
  • Ца - 134
  • Цв - 114
  • Це - 569
  • Ци - 462
  • Ч - 301
  • Ча - 413
  • Че - 1083
  • Чи - 357
  • Чу - 361
  • Ш - 411
  • Ша - 619
  • Ше - 538
  • Ши - 404
  • Шк - 121
  • Шл - 185
  • Шп - 201
  • Шт - 330
  • Шу - 269
  • Щ - 433
  • Ъ - 4
  • Ы - 31
  • Ь - 4
  • Э - 886
  • Эк - 862
  • Эл - 704
  • Эн - 329
  • Эп - 214
  • Эс - 185
  • Эт - 188
  • Ю - 505
  • Я - 917

Обсуждение править

В английской версии вики-словаря (Index:English/a1) применены очень интересные стили.
В частности, там все слова разбиты на колонки, при этом количество колонок зависит от ширины окна браузера (благодаря css-стилям "width: 20em" и "float: left").
Выяснил, что достигается это за счет наличия дополнительных сss-классов в английском викисловаре (ссылка на его css). В css-стилях русского викисловаря (ссылка на наш css) я таких классов не обнаружил.
Вопрос: можно ли их (css-классы) как-то добавить в русских викисловарь и что для этого нужно сделать?
Я попытался отыскать нужный код, в частности нас явно интересует класс ".index". По поводу остального — скорее всего достигается шаблонами. -- Vitalik7 (обсуждение) 19:39, 2 августа 2013 (UTC)Ответить[ответить]

Я за адаптивный дизайн. Добавил классы для index в MediaWiki:Common.css. Попробовал применить для страницы Индекс:Английский язык/A, Индекс:Русский язык/А и Индекс:Русский язык/А/г. Есть несколько замечаний для применения этого стиля. Во-первых, пришлось убрать пометки, что слово из орфографического словаря Лопатина. Они слишком длинные. Я не вижу в них особого смысла, но если сократить, то их можно вернуть. Во-вторых, я убрал содержание. Оно слишком громоздко. Но в шаблоне {{Русский индекс}} ссылки формируются на двухбуквенные заголовки, а они у нас трёхбуквенные. Это нужно исправить. И в-третьих, часть индексов вынесено на отдельные страницы. Например раздел Индекс:Русский язык/А#аг ссылается на Индекс:Русский язык/А/г. Наверно вместо ссылки лучше сделать подстановку включением. Don Rumata 10:10, 3 августа 2013 (UTC)Ответить[ответить]
Отлично, Спасибо большое! Получилось просто замечательно!
Я уже успел попробовать альтернативное решение: нашел в википедии очень интересный шаблон "кол" (описание) и скопировал его сюда. Он автоматически разбивает список на нужное фиксированное количество колонок. Пример использования приведу ниже. Однако "адаптивный дизайн" с использованием css-класса .index, здесь подойдет, конечно, намного лучше, т.к. количество колонок в нем меняется автоматически.
По поводу адаптивного краткого содержания (список ссылок на подразделы) и прочего, я, кажется, разгадал, как это сделано в английском викисловаре и смогу применить это для нашего.
"Подстановка включением" - имеется в виду просто скопировать содержимое подраздела в основной раздел?
У меня есть идеи по переразбитию индекса по страницам, почему бы не сделать это как в английском викисловаре? Чуть позде напишу более подробно и с точными цифрами.. --Vitalik7 (обсуждение) 11:27, 3 августа 2013 (UTC)Ответить[ответить]
Да, а по поводу пометки "Орфографический словарь. Сост. Лопатин" — ее ведь можно сделать просто нумерованной сноской, как в обычной википедии (секция "Примечания"). В дальнейшем туда могут добавляться и другие словари. По-моему, было бы очень удобно. --Vitalik7 (обсуждение) 11:34, 3 августа 2013 (UTC)Ответить[ответить]
Гм.. По поводу "примечаний" частично беру свои слова обратно. Именно тот самый механизм использовать не получится. Но что-то подобное подходящее, думаю, придумать можно. Подумаю. --Vitalik7 (обсуждение) 12:50, 3 августа 2013 (UTC)Ответить[ответить]
Мне кажется, чем меньше страниц будет в индексе, тем лучше.
В английском викисловаре сделали по 1-2 страницы на букву, при чем если идет деление на две страницы, то строго по буквами m-n.
У нас именно так красиво, к сожалению, сделать не получится (специфика распределения слов по буквам), но в целом как идея — ведь довольно неплохо!
В связи с этим вопрос: сколько максимум слов считается нормальным и допустимым иметь на странице? И по каким критериям определяется это количество?
Для информации: в текущем разбиении встречаются и тысяча, и две, и пять и даже почти двенадцать тысяч (Индекс:Русский язык/П/о). --Vitalik7 (обсуждение) 11:55, 3 августа 2013 (UTC)Ответить[ответить]
Я тоже не вижу большого смысла в помете о словаре.
Однажды я открыл страницу в ВС, и браузер просто заглох. Какая точно страница, не помню. В общем, делить индекс нужно примерно по байтам; не больше трёхсот, наверное.
Желательно также завести бот, аналогичный тому, что в английском ВС. Ведь индекс весьма неполный, и вручную его никто, кажется, не обновляет.--Cinemantique (обсуждение) 13:24, 3 августа 2013 (UTC)Ответить[ответить]
Спасибо за ответ!
По поводу пометах о словарях.. Их можно сделать, например, так: Участник:Vitalik7/Русский_язык/Р1 и не навящиво выглядит, и информация есть. (Р1 - эта страница не включена в индекс, создаю ее для примера по образу английского ВС)
Пока этот словарь только один - польза действительно сомнительная. Но если подключить и другие орфографические, толковые и прочие словари, то тогда резонов использовать эту помету будет больше, как считаете? К слову, планирую в ближайшем времени заняться этим.
По поводу размера страницы — имеется в виду объем wiki-текста, или объем всей получающейся html-страницы целиком?
Для сравнения: wiki-текст буквы "О": 57 Кб, html-страница: 516 Кб; wiki-текст для "Ра": 195 Кб, а максимальный сейчас wiki-текст для "По": 406 Кб.
По поводу бота.. Считается таковым любой скрипт, автоматизирующий работу с ВС или же он должен быть обязательно написан на определенном языке с использованием определенных библиотек?
Мои скрипты на питоне, библиотеки пока никакие не использую, работаю с вики как "обычный браузер" по http.. --Vitalik7 (обсуждение) 13:57, 3 августа 2013 (UTC)Ответить[ответить]
Я в этом вопросе некомпетентен. Может, другие редакторы подскажут… Знаю только, что для бота заводится отдельная учётная запись, от имени которой совершаются правки; и тот самый бот обрабатывает дамп базы данных Викисловаря. Кое-что рассказано здесь. Что касается ссылок на словари: их можно указывать в самих статьях. Для чего они нужны в индексе, неочень понятно. Разве что для красных ссылок.--Cinemantique (обсуждение) 14:33, 3 августа 2013 (UTC)Ответить[ответить]
По поводу ссылок на словари: как тогда быть со словами, которых еще нет в Викисловаре? Ведь тогда будет не совсем понятно, откуда слово было добавлено в индекс. --Vitalik7 (обсуждение) 14:38, 3 августа 2013 (UTC)Ответить[ответить]
Да, вот я и упомянул красные ссылки. Хотя нужны ли они там вообще? Полезнее будет список недостающих статей вынести в отдельное место. Да и ботом будет проще обрабатывать индекс.--Cinemantique (обсуждение) 14:43, 3 августа 2013 (UTC)Ответить[ответить]
Если так, то согласен. Получается: 1). нужна отдельная страница с недостающими словами, на которой будут указываться ссылки на словари-источники (да и вообще на любые источники использования "нового" слова), 2). на существующих страницах нужна секция (возможно уже существует?), где можно размещать информацию о том, в каких словарях слово присутствует. Верно?.. --Vitalik7 (обсуждение) 14:55, 3 августа 2013 (UTC)Ответить[ответить]
Красные ссылки это нестрашно. Массовое добавление слов в индексы хорошо бы сначала обсудить. Если решение будет принято, то словарь-источник можно будет указать в комментарии к правке. Don Rumata 14:56, 3 августа 2013 (UTC)Ответить[ответить]
Я имел в виду: для начала добавить то, что уже есть в ВС, но отсутствует в индексе. Добавление вручную — это не самый эффективный способ, как мне кажется.--Cinemantique (обсуждение) 15:11, 3 августа 2013 (UTC)Ответить[ответить]
Так у нас индекс — это «список всех слов, которые включены в какие-либо словари». А для чего такое уточнение?..--Cinemantique (обсуждение) 15:22, 3 августа 2013 (UTC)Ответить[ответить]
добавить то, что уже есть в ВС, но отсутствует в индексе — правильно ли я понял: т.е. автоматически добавить в индекс те слова, которые уже есть в ВС, но в индекс добавлены еще не были, так? --Vitalik7 (обсуждение) 15:40, 3 августа 2013 (UTC)Ответить[ответить]
А вообще запутался, не очень понял, к чему именно относятся последние два сообщения?.. :( --Vitalik7 (обсуждение) 15:40, 3 августа 2013 (UTC)Ответить[ответить]
На главной странице справа есть колонка автоматических индексов статей. Ручные индексы, это нечто вроде координационных списков в Википедии. Don Rumata 15:43, 3 августа 2013 (UTC)Ответить[ответить]

Возможно как-то подвести итоги обсуждений (которые были здесь, а также в Обсуждение_индекса:Русский_язык и Обсуждение_участника:Vitalik7#Индексы)?
Что уже решено, что еще не решено, но можно решить, а что вообще не может сейчас решиться?

  1. Разрешается ли и нужно ли добавить в Индекс:Русский язык все недостающие слова из Категория:Русский язык в полуавтоматическом режиме?
    Если да, то тогда актуальны следующие вопросы 2, 3, 5 и 6.
  2. Использование адаптивного "float-стиля" (<div class="index">) можно считать утвержденным для Индекса?
    • Если да, то как быть со ссылками на словари (см. следующий вопрос 3 ниже)
  3. Нужны ли ссылки на словари в Индексе? (этот вопрос по идее решить сейчас не представляется возможным, т.к. нет всех заинтересованных участников)
    Т.к. решить определенно этот вопрос пока нельзя, то немного другой вопрос: как следует поступать со страницами Индекса сейчас, если их редактировать?
    • Удалить пометку о Лопатине, но если будет принято решение, что она в Индексе нужна, то потом просто вернуть в полуавтоматическом режиме (сделано сейчас таким образом со страницами Индекс:Русский язык/А и Индекс:Русский язык/А/г).
    • Оставлять пометку о Лопатине. Если так, то тогда в каком виде:
      1. Использовать шаблон Орфографический словарь. Сост. Лопатин (если использовать адаптивный float-стиль, то будет некрасиво, слишком длинные строчки)
      2. Заменить на сноску ref (если использовать адаптивный float-стиль, то будет некрасиво, объяснение здесь в конце со скриншотом: Обсуждение_участника:Vitalik7#Индексы)
      3. Заменить на <sup>[1]</sup> или что-то в этом роде (аналогичное замечание-недостаток, что и для сноски)
      4. Заменить на <small>[1]</small> или что-то в этом роде (оформленное в виде шаблона), при этом можно делать или не делать ссылки, это уже другой вопрос.
        Внешний вид вроде приемлемый.
      5. Оставить любую другую пометку, хоть просто звездочку.
      • Если использовать сноски или <sup>, то можно попробовать найти решение глюков с float-стилями, но пока ничего в голову не приходит.
  4. Нужна ли нам отдельная страница со словами, которые есть в индексе, но еще нет в ВС (т.н. красные слова)?
    Некоторые мысли по этому поводу:
    • Ее можно составлять автоматически на основании Индекса (просто выбирать оттуда все красные слова)
    • Предполагается, что на такой странице будут ссылки на источники, откуда слово появилось, взято.
    • Если генерировать такую страницу автоматически на основании Индекса, то и в Индексе такая информация должна быть.
      • Но в принципе, наверное, не обязательно, т.к. можно выцеплять из индекса только новые, если таковые будут там появляться и помечать их как-то по-особому
    • Можно добавлять новые слова на эту страницу (либо вручную, либо автоматически из других источников и т.п.).
      • При этом по идее эти же слова должны появиться и в Индексе тоже.
  5. Нужно ли более подходящее переразбиение страниц индекса? И какое?
    • Мне, например, кажутся немного неудобными ссылки вида "см. аб", т.к. приходится несколько ра