Оценщик.ру Добавить в избранное
Сделать стартовой
 
Оценщик.ру
  Новости
События
Форум
Поиск по сайту
Контакты | Реклама
Работа
  Поиск
Вакансии
Резюме
Добавить резюме
Добавить вакансию
Оценка
  Методики
Отчеты об оценке
Обзоры, аналитика
Справочники и нормативы
Словарь оценщика
Курсы оценщиков
СРО Оценщиков
Оценка для опеки
Интерактив
  Кадастровая оценка
Интервью
Статьи
Рейтинги
Вопрос-ответ
Авторы на Оценщик.ру
Проекты Отдела оценки Росимущества
Конкурсы, тендеры
Экспертиза
 Рабочая группа по экспертизе отчетов об оценке

Рекомендуем оценочную компанию:



Статьи

Оставить комментарий | Читать комментарии

О поиске аналогов и кодов машин и оборудования в компьютерной оценочной системе ASIS® с помощью её синонимического словаря-справочника. «Мощность» русского языка по данным этого словаря

Тришин Виталий Николаевич,
Председатель Совета директоров компании «ОКП», г. Москва (http://www.trishin.ru),
кандидат физико-математических наук

1. О русском языке, а также о назначении и особенностях словаря.

«В начале было Логос»
(Евангелие от Иоанна)

«Язык есть дом бытия. В жилище языка обитает человек. Мыслители и поэты — хранители этого жилища»
( М. Хайдеггер «Время и бытие»)

«Подлинная поэзия перестраивает жизнь, и её боятся»
(О.Э. Мандельштам, из «Воспоминаний» Н.Я.Мандельштам)

В настоящее время диалектологами принято считать (см., например, работы Г.О. Винокура), что в русском языке имеются 3 диалекта (наречия), а именно: северный диалект (ладого-тихвинский, вологодский и костромской говоры) и южный диалект (курско-орловский и рязанский говоры), между которыми находится территория с населением использующим, как правило, среднерусский диалект (среднерусские говоры) – Псковская, Тверская, Московская, Владимирская, Ивановская, Нижегородская области. Отличия в речи населения различных регионов России уменьшились в связи с развитием в XX веке образования, СМИ, миграцией населения. В Сибири и на Дальнем Востоке нет относительно чёткого деления территории на диалектные зоны. Диалектные зоны сохранились по большей части в сельской местности. На диалектах, говорах написаны многие выдающиеся произведения русской литературы: например, поэма «Песнь о Великой Матери» Н.А. Клюева написана на северном диалекте, этот же диалект использовал и В.И. Белов; на южном диалекте писали многие свои произведения В.И. Даль, М.А. Шолохов. По-видимому, на исходном  древнерусском языке говорили в Киевской Руси, который затем распространился на восток в связи с переносом столицы России из Киева (был столицей Руси в 882 – 1243 гг.) сначала во Владимир, а затем из Владимира в Москву (1389) (многие историки считают первой столицей России до Киева Великий Новгород (862 – 882), а также Ладогу). Западные же области Малороссии (Правобережье) попали, по большей части, на 4 с половиной века (разные территории по-разному) под власть Великого княжества Литовского (условно 1340 – 1569), Польши (условно 1569 – 1793), а также часть территории и в разные годы Турции и Австро-Венгрии. В 1793 в результате второго раздела Польши Правобережная Украина вошла в состав Российской Империи вместе с большей частью Польши, и сегодняшний украинский язык – это, так считают многие лингвисты-историки, ополяченный старорусский язык (паны говорили со своими крестьянами по-польски) [Волконский http://www.ukrstor.com/ukrstor/volkon.html.].

«Создававшийся преимущественно в Галиции, с использованием множества заимствований из польского, немецкого, других языков, украинский язык, который не следует путать с малорусским наречием, был понятен в основном галичанам, привыкшим жить бок о бок с поляками и немцами». [http://telegrafua.com/country/12715/]. Cлова из малорусского и белорусского наречий помещал в свой словарь и Владимир Даль наряду со словами из губернских диалектов великорусского наречия. Эти три наречия и составляли, как тогда было признано, русский язык.

«До монгольского нашествия литературный язык, с незначительными диалектными различиями, был совершенно одинаков. Так же и быт был един от Киева до Ладоги» [В. В. Кожинов, см. http://www.patriotica.ru/religion/kozhinov_idea/htm]. «В IX столетии Кириллу и Мефодию, когда они создавали славянскую азбуку, при их путешествиях не нужен был переводчик, потому … все славяне говорили на одном языке» (Балязин В. Н. Неофициальная история России, 2007). И именно на Русском Севере сохранились былины Киевской Руси! После революции 1917 года малорусский и белорусский языки, считавшиеся в Российской Империи диалектами русского языка, приобрели статус официальных, государственных. И названия «Украина» и «украинцы», иногда встречавшиеся в литературных произведениях до революции 1917 года, закрепились также за Малороссией и малороссами фактически только лишь при большевиках [http://gold-nike.inspaceblog.net/?p=134]. По мнению автора, истинной целью действий по «выдавливанию» русского языка и культуры сегодняшней «украинской элитой» да и «элитами» других стран бывшего СССР является ограничение доступа своих граждан к подлинной русской культуре, в частности, к великой русской поэзии Лермонтова, Тютчева, Фета, Анненского, Рубцова, Передреева, Соколова, Левитанского и многих других (более 100 поэтов мирового уровня, чего и близко нет ни в одной стране мира!) и к русской песне. (По словам Кожинова «Русская песня – главная основа отечественной культуры». [http://www.kroupnov.ru/news/2011/02/02/10783/ ,«Антология русского лиризма. XX век», http://studia-vasin.ru/vstupant.htm]; «Без песен мы не люди, не русские люди» (А.Н. Васин, журнал «Родина», №3, 2005 год, http://studia-vasin.ru/rodina.htm).

А также для дальнейшего разделения единого в культурном плане народа и варваризации населения, и, тем самым, защиты своих экономических интересов и личного бизнеса. При этом и в России, и на Украине, и в других странах бывшего СССР пошлейшей масс-культуре на русском языке, непотребству, шансону-блатняку никакие препоны не ставятся. А русскую жизнь и в России, и за рубежом заставляют изучать уже второе столетие по произведениям Салтыкова-Щедрина, Достоевского и других «назначенных» классиков русской литературы [«Читаю Лермонтова» А.Н. Васина, http://studia-vasin.ru/]. Отмечу, что через язык происходит и прямое управление людьми. Например, чтобы заставить одних людей относиться по отношению к другим определенным образом изобрели в 20-30-х годах 20-го века слова «кулацко-монархический», «кулацко-помещичий» и т.п.

Кстати, и в других языках (странах) имеются региональные особенности, например житель Нью-Йорка не всё может понять из английской речи жителя Техаса. Даже в одном городе могут быть несколько диалектов. (Так в Лондоне известны диалекты английского языка C ockney, Estuary English и др.). В Великобритании насчитывается более 25 диалектов, а всего в английском языке имеется более 90 диалектов. Однако эти страны никто не разделяет, как бывший СССР.

Примечание. В данный словарь вошли и слова из местных диалектов, в том числе и многие из малорусских и белорусских слов, упоминаемые как русские в дореволюционных словарях русского языка (наряду с вологодскими, архангельскими и др.), но регион их употребления в словаре не указан. Интересующиеся данным вопросом могут обратиться к словарю В. И. Даля и другим.

Электронный синонимический словарь-справочник первоначально разрабатывался с 1993 года как часть компьютерной системы помощи оценщику и аудитору ASIS® (Appraiser Support Info System) для быстрого поиска с высокой точностью аналогов для оцениваемых машин и оборудования в базах данных системы, а также для правильной их кодификации по классификатору ОКОФ, см. статью В.Н.Тришина "Задача классификации основных средств согласно классификатору ОКОФ выбора амортизационной группы и оставшегося срока полезного использования", http://www.trishin.ru/left/publishes/classification-task/ .

В процессе развития словарь приобрел самостоятельное значение и в настоящее время распространяется отдельно от системы ASIS® с сайта компании «ОКП». В месяц его скачивают с сайта более 1000 человек практически со всех стран мира. В помещенной на вышеупомянутом сайте версии 6.9 от 24.09.2013 (язык программирования Visual Fox Pro ) словаря-справочника содержится 508 тыс. слов и выражений (490 тыс., если убрать дублирование слов с буквами «е» и «ё», см. ниже), из которых 390 тыс. снабжены синонимами, квазисинонимами, фразеологическими синонимами. Всего синонимов (поясняющих слов, синонимических связей) около 1998 тысяч (это сумма по всем словам относящихся к ним синонимических связей). Отметим также, что сокращения (а их в русском языке более 130 тысяч, см. сайт http://www.sokr.ru/) в данный словарь не входят, кроме слоговых сокращений типа комсомол, минфин, спецназ; не входят в словарь и топонимы для некрупных объектов (села, фамилии, речки и т.п.) и т.п.

В более современной программной оболочке словаря версии 8.3 (от 15.04.2013), написанной на языке С+, имеется более мощная система запросов, в ней 489 тыс. слов. Однако в ней имеется около 300 слов, исправленных в новой версии 6.9, и в настоящее время эта версия существенно перерабатывается.

Словарная база включает слова не только технического содержания, но и слова из словарей и справочников по всем отраслям знаний: от астрономии до японской живописи. При составлении словаря использованы изданные словари: орфографические, синонимические, фразеологических синонимов, толковые, церковно-славянских слов, иностранных слов, арго (кроме заведомо ненормативной лексики) и т.п. 19-21 столетий. Кроме того, для пополнения словаря активно использовались газеты, журналы, Интернет, автоподсказчики слов по их началу из Yandex и Google (с проверкой по другим источникам), так как даже в самых крупных печатных словарях отсутствуют десятки тысяч широко распространенных в быту и прессе современных слов, например, госучастие, доследственный, эсэмэска, моногород, спецлаборатория, промпроизводство, медсправка, педколледж, зоопарикмахер, внеоборотный, внеофисный, предшкольный, межкорпоративный, самораспаковывающийся, кибертерроризм, погранслужба, госсимволика, автоэксперт и т.д. В данном словаре имеется 272 слов, начинающихся с «нано», а в новом Большом академическом словаре таких слов имеется всего 13. Основной пласт слов академических словарей занимают, как правило, слова и отрывки с соответствующими словами из произведений русских писателей 19 – 20 веков А.И. Герцена, Н.П. Огарева, А.Ф. Писемского, В.Г. Белинского, Н.Г. Чернышевского, А.М. Горького и многих других, которые считались классиками в работах советских литературоведов. Слов из современного обиходного языка в них, как правило, немного. В словаре-справочнике представлены и устаревшие и редкие слова из академических словарей. Этот словарь является попыткой создания объединённого словаря русского языка, о необходимости создания которого писал русский литературовед и лингвист-русист, академик АН СССР В.В. Виноградов: «Между тем потребность в историческом словаре русского литературного языка была осознана очень давно - почти при самом зарождении русской лексикографической науки. Мысль об историческом словаре русского литературного языка не вполне была чужда патриарху русского "корнесловия" акад. А. С. Шишкову. "Все находимые в священных писаниях, в летописях, в законах, в преданиях, в народных сказках и песнях самые старинные, хотя бы неупотребительные, но чистые славянские слова должно внесть в Словарь"- учил он.» (Виноградов В.В. Избранные труды. Лексикология и лексикография. - М., 1977.). Что касается роста числа слов в крупнейших словарях, то «знаменательны такие соотношения цифр: в "Словаре Академии Российской" (1806-1822) содержалось 51388 слов; в "Словаре церковнославянского и русского языка" (1847) уже было помещено 114749 слов; "Толковый словарь" В. И. Даля выходил за пределы 200 000 слов» (В.В. Виноградов).

Предлагаемый электронный словарь многофункционален. 

Он может быть использован как орфографический словарь русского языка для проверки правильности написания слов, особенно при составлении документов с использованием сложных и редко встречающихся специальных терминов. Следует сказать, что многих слов из данного словаря нет и в самых больших орфографических словарях, а есть такие слова, написание которых в словарях, справочниках, энциклопедиях отличается. Например, в орфографическом словаре В. В. Лопатина имеются слова «кросс-курс», «кортико-висцеральный» и «кристально честный», а в орфографическом словаре Б. З. Букчиной, Л. П. Какалуцкой – они же пишутся как «кросскурс», «кортиковисцеральный» и «кристально-честный» . Отметим также, что в орфографическом словаре В. В. Лопатина с началом «кортико» имеется 5 слов, а в данном словаре их 45. Еще пример – слово «крупнодроблёный». В словарях В. В. Лопатина и С. И. Ожегова его нет, в словаре С. Н. Корчемкиной, С. К. Кашкиной оно оформлено как «крупнодроблёный», а в словаре Б. З. Букчиной, Л. П. Какалуцкой как «крупно дробленный». В Русском орфографическом словаре РАН под редакцией В. В. Лопатина и О. Е. Ивановой имеются слова «пухоперовой», «пушно-заготовительный», «пушно-меховой», а в Большом академическом словаре русского языка эти же слова пишутся как «пухо-перовой», «пушнозаготовительный», «пушномеховой». Единицы измерений «авто-час», «нормо-час», «кормо-час», «станко-час», «пече-час», «полёто-час» и др. в разных орфографических словарях, справочниках, энциклопедиях пишутся то слитно, то через дефис. В данном словаре они все пишутся через дефис. Зато слово «политчас», не являющееся единицей измерений, пишется слитно. Слова с окончанием «кислый» (а их в данном словаре 278) пишутся в словарях и справочниках по химии то слитно, то через дефис. В данном словаре такие слова все пишутся слитно (кроме «нехимических» терпко-кислый, солёно-кислый и др.). И даже в орфографических словарях разных лет выпуска под ред. В. В. Лопатина есть слова по-разному оформленные, например, слова плоско-вогнутый и плоско-выпуклый (плосковогнутый и плосковыпуклый), фликер (фликкер) и фликерный (фликкерный) и др. Имеются расхождения в словарях в написании существительных с окончанием –ие (таких слов в словаре 14838), например, бдение, безлуние, безмолвие и с окончанием –ье (таких слов в словаре 1943), например, ауканье, безлюдье, безлесье. Приходилось в этих и подобных случаях принимать «волевое» решение на основания даты выпуска словаря.

Этот словарь может служить в качестве подсказчика слов по их началу в интернет-поисковике существенно более мощного, чем автоподсказчики слов Yandex и Google. Возможно создать также автоподсказку по дополнительным параметрам, например, выдавать слова с заданным не только началом, но и окончанием.

Как словарь синонимов и поясняющих слов он может использоваться при поиске близких по смыслу слов и выполнять функции толкового словаря при определении значений незнакомых слов. Он может быть реализован в виде Интернет онлайн-версии со всеми поисковыми возможностями, реализованными в компьютерных версиях 6.* (на языке Visual Fox Pro) и 8.* [на языке C#, см. ниже]. Для сравнения, в синонимическом словаре Н. А. Абрамова, размещенном на сайте Yandex в online , имеется 19 тысяч слов. Данный словарь вместе с алгоритмом поиска может быть встроен нами и в другие компьютерные и Интернет системы и служить инструментом для филологических наблюдений и исследований языка благодаря развитой системе запросов по разным признакам слова (по значению, составу, шаблону, синонимии и т.д.), что невозможно ни в online-словарях, ни тем более в книжных словарях.

Сочинители стихов имеют возможность пользоваться словарём как машиной для подбора рифм (шутка).

Специалисты по всевозможным отраслям знаний могут им пользоваться как справочником для поиска нужной информации. В словарях и справочниках в виде книг слова упорядочены по алфавиту, и, если вы не помните точно, как оформлено нужное слово, то вам приходится просматривать сплошь весь словарь или справочник. В электронном словаре можно искать нужное слово по обобщенному понятию, например запрос (в версии 6.9) по слову «рыба» выдаст в алфавитном порядке список из 800 названий различных рыб, по слову «растение» – 4468, «песня» – 163, певец 98,«гриб» – 356, «столица» – 274 названия существующих и бывших столиц, «минерал» – 5651, «взрывчатка» – 234, «фермент» – 305, «богиня» – 347, милиционер – 67, «быстро» – 305, «умный» – 117, «глупый» – 229, «хороший» – 289, «плохой» – 309, «избивший» (избить) – 260, «трезвый» – 35, «выпивший» (выпить) – 354, «пьяный» – 338 (американский президент Бенджамин Франклин собрал около 200 синонимов слова «пьяный» (англ. Drunk)), и т.д.

В качестве примера «мощности», многозначности русского языка укажем на такие данные из этого словаря версии 6.9:

в русском языке, согласно словарю, имеют синонимические связи (синонимы, квазисинонимы, фразеологизмы) более 390119 слов и словосочетаний,
более 10 синонимов имеют 42692 слов и словосочетаний,
более 20 синонимов имеют 17252 слов и словосочетаний,
более 30 синонимов имеют 8526 слов и словосочетаний,
более 40 синонимов имеют 4700 слов и словосочетаний,
более 60 синонимов имеют 1720 слов и словосочетаний,
более 100 синонимов имеют 430 слов и словосочетаний,
более 200 синонимов имеют 89 слов и словосочетаний,
более 400 синонимов имеют 25 слов,
более 600 синонимов имеют 15 слов,
более 1000 синонимов имеют 9 слов.

Такое большое количество синонимов в данном словаре обусловлено двумя причинами:

1. В различных словарях синонимов словарные статьи к одному и тому же слову значительно отличаются, и, по сути, они дополняют друг друга. А поскольку в электронный словарь включены слова с синонимами практически из всех известных словарей, то в данном словаре пользователь получает их объединенный вариант.

2. Механизм перекрестных ссылок, реализованный в словаре, резко увеличивает число синонимов к словам. Поясним на примере. В словарях арго одним из синонимов к слову «оттянувшийся» обычно указывают слово «отдохнувший», но отдельной словарной статьи со словом «отдохнувший» в словарях арго нет. Более того, ни в одном синонимическом словаре среди синонимов к слову «отдохнувший» мы не нашли слова «оттянувшийся». Другие примеры: «схлестнувшийся» – повздоривший, «сдавший» – «выдавший», «сдвинутый» – «ненормальный», «содравший» – «укравший», «убойный» – «замечательный» и т.д. Электронный словарь устанавливает все возможные соответствия: синонимами в словаре могут быть не только слова и словосочетания современного общеупотребительного языка, но и устаревшие слова, просторечные, жаргонные, областные, слова профессиональной речи и т.п.

Предлагаемый словарь имеет несколько особенностей.

1.Отсутствие разделения омонимов, что приводит к тому, что в одной группе синонимов к слову, скажем, «стан» оказываются слова «лагерь», «блюминг» и «талия». Для развитого носителя языка это не представляет сложности, но для иностранца, желающего углубиться в недра русского языка, отсутствие разделения омонимов будет, конечно, представлять большие сложности. Для того же «стана» правильно было бы иметь несколько словарных статей, например:

Стан 1 => блюминг, трубопрокатник, листопрокатник, ...
Стан 2 => становище, стойбище, станица, бивуак, лагерь, ...
Стан 3 => торс, талия, поясница, ...

В будущих версиях словаря, возможно, такое разделение будет предусмотрено.

2.Отсутствие разделения синонимических и родо-видовых связей. Родо-видовые отношения – это, вообще говоря, предмет тезаурусов. Синонимическое отношение - это отношение эквивалентности, которое разбивает все слова на классы эквивалентности. А родо-видовое отношение - отношение частичного порядка. В идеале должна быть вкладка для синонимов, для родительских терминов и для дочерних. Такое разделение также планируется произвести в программе словаря после завершения работы над его пополнением.

3.Отнесение слова в словаре к какой-либо лексико-грамматической категории (группы частей речи) чисто условно, что объясняется прикладным характером словаря. Слова в версии 6.9 распределены на четыре группы:

1. Существительные, числительные - 226180.

2. Прилагательные, причастия, глаголы, деепричастия – 254415.

3. Наречия, сравнительные степени, сращения - 26341.

4. Частицы, предлоги, междометия и др. – 1082.

При этом в справке и запросе названия групп «обрезаны», а сокращения, первоначально присутствующие в ранних версиях словаря, удалены, как правило, из словарной базы.

Если слово может выступать в роли разных частей речи (омоформы), то оно отнесено к той, в форме которой наиболее часто встречается. Фразеологические и синтаксические синонимы, не определяемые вообще морфологически (как словосочетания), приписаны к части речи того слова, к которому эти фразеологические и синтаксические синонимы привязаны. В словаре версии 8.3 имеется 5 групп частей речи (в отдельные группы выделены прилагательные и фразеологизмы, в которые ошибочно попали некоторое количество обычных слов, а 3-я и 4-ая группы из версии 6.* объединены), которые на экран для слов не выводятся, а даны только в запросе и справке по запросу. Часть речи используется для ускорения поиска нужных слов и лингвистических исследований. Замечу, что часть речи не приводится и во многих книжных словарях.

4. В словах специально-технического лексикона буква ё заменена на букву е, в обрабатываемых системой ASIS® материалах буква ё заменена также на букву е, поэтому в таких словах эта замена в словаре-справочнике сделана. В последних версиях словаря-справочника слова с буквой ё имеются, а единственным синонимом к ним служат такие же слова с заменой буквы ё на букву е. Всего слов и выражений с буквой ё в словаре имеется 18405, в основном из словаря Т. Ф. Ефремовой, академических словарей (последним отдавалось предпочтение в случае разночтений), других источников; в частности, использовались запросы из данной же словарной базы по фрагментам слов с имеющейся буквой ё с последующим анализом найденных слов. Это значительно прибавило число слов с буквой ё из специальных словарей, например технических, где буква ё, к сожалению, обычно игнорируется.

5. Во всех словах вместо прописных букв используются строчные буквы. 

6. Нет знаков ударений в словах.

7. Отсутствуют пометы: устарелое, просторечное, областное и т.п.

8. Частично уточнена орфография касательно «бесов», поврежденная в 1918 году, а именно, наряду со словами бесчестный, бестолковый, бессовестный и т.п. введены в словарь и слова безчестный, безтолковый, безсовестный и т.п. [книга «Жизнь происходит», изд-во «Студия», Москва, 2009]. Хорошо хоть этим бесам не удался планируемый ими перевод русского языка с кириллицы на латиницу!

9. Глаголы представлены не в одной нейтральной форме, а в нескольких наиболее часто используемых причастных формах, как они представлены и в Русском орфографическом словаре РАН под редакцией В. В. Лопатина и О. Е. Ивановой.

Однако устарелые, просторечные, жаргонные глаголы – только в одной. 

Перечисленные особенности возникли из специфики и целевого назначения первоначального словаря, заключающихся в распознавании близких по смыслу именных словосочетаний в прикладной компьютерной системе ASIS®. На использование словаря в практической работе с текстами и документами отмеченные особенности не влияют. 

Понятие «синоним» используется в расширенном смысле. Нас интересует в первую очередь, являются ли взаимозаменяемыми конкретные слова в именных словосочетаниях (с сохранением хотя бы частично их смысла) или нет. Иначе говоря, улучшит ли установление синонимической связи между двумя конкретными словами качество распознавания смысла именных словосочетаний или нет при компьютерной обработке словосочетаний. А является ли данное слово точным синонимом другого слова или только смежно ему по смыслу (то, о чем часто спорят филологи) нас интересует во вторую очередь. 

Замечание. Если устранить дублирование слов с буквой «ё», глаголов в различных формах, а также фразеологизмы, то уникальных слов в словаре останется не менее 415 тысяч, а вовсе не 200 тысяч, как ошибочно указано на популярном филологическом портале Philology.ru, (см. http://www.philology.ru/links.htm).

Отмечу, что в самом полном словаре английского языка Уэбстера имеется 425 тыс. слов, число же синонимических связей в английском языке неизвестно.

2. Устройство словаря.

Экран компьютера разделен на две части (панели), размеры которых можно регулировать с помощью мыши.

На экране слева помещены слова в порядке алфавита вместе с указанием части речи и числа синонимов. Справа в порядке алфавита перечислены синонимы к тому слову на левой панели, на котором стоит курсор. К словам-синонимам на правой панели также указаны части речи и число синонимов.

Любой синоним (поясняющее слово) к конкретному слову имеет, в свою очередь, также синонимы (поясняющие слова). Для их просмотра достаточно в поле «наименование» правой панели сделать двойной клик левой клавишей мыши на выбранном синониме. При этом выбранное слово переходит из правой панели в левую.
Для удаления синонимов (толкований) нужно выделить слово в списке синонимов (толкований), а затем нажать кнопку со знаком минус из меню.

3. Поиск слов.

Простейший поиск слов выполняется по совпадению начального фрагмента слова с поисковым выражением. Для получения статистической информации и анализа структуры словарного фонда русского языка в систему добавлена возможность получения выборок по запросам.

В данном электронном словаре можно осуществлять практически любые запросы к словарной базе. В нём можно искать искомое слово по маске слова (включающей известные буквы и условные символы, обозначающие произвольную букву, произвольное число произвольных букв и т.п. – версии 8.3), а также по его синониму или обобщённому понятию.

Для каждого слова  отображаются синонимы всех его смысловых значений и слова, связанные с ним родо-видовым отношением как с определяющим, так и с обобщающим понятием.

Для лиц, нуждающихся только в простых запросах, предлагается «Построитель запросов» (версия 8.3) – аналог системы запросов версии 6.9. В качестве параметров «Построителя запросов» используются:

- начало слова,
- фрагмент слова,
- окончание слова,
- часть речи,
- количество синонимических связей слова,
- количество символов в слове.

При сложных запросах можно осуществлять поиск по комбинации параметров. Онлайн-словари делать такие запросы не позволяют.

Отобранный список выдается на экран, упорядоченным по алфавиту, по числу синонимов и т.д. 

Например. Запрос по фрагменту «вита» (слово «вита» в переводе с латинского означает «жизнь») даст 282 слова, а запрос с флексией «метрия» (от греческого слова «метрео» – «измеряю») выдаст список из названий 424 дисциплин, в которых что-то меряют, а запрос с флексией «логия» (от греческого слова «логос» — слово, учение) выдаст список из названий 1294 научных и квазинаучных дисциплин. Замечу, что в «Советском энциклопедическом словаре» (4-е изд., 1990) содержится только около 200 статей о науках, направлениях и квазинауках, включающих в название элемент «-логия», которые перечислены и в Википедии, см. http://ru.wikipedia.org/wiki/-%EB%EE%E3%E8%FF.

4. Алгоритм поиска близких по смыслу наименований объектов в системе ASIS®.

Наименования объектов представляют собой именные словосочетания, содержащие главное слово и несколько уточняющих слов. Например, "станок настольно-сверлильный 2М-112", "вертикально-фрезерный станок", "холодильная установка 24 МКТ 280". Предполагается, что в наименовании всегда есть одно главное слово, которое находится в именительном падеже в единственном или множественном числе. Алгоритм поиска близких по смыслу наименований начинается с выделения главного слова и всех его синонимов. Затем выделяются уточняющие слова и составляются списки их синонимов. Поиск близких по смыслу наименований производится в базе наименований и начинается с выделения всех наименований, имеющих главное слово, совпадающее с главным словом входного наименования или его синонимом. Для каждого из отобранных наименований рассчитывается значение критерия близости. Критерий является суммой экспериментально подобранных весовых коэффициентов для главного и уточняющих слов. Например, главное слово имеет вес 1, синоним главного слова 0.9, уточняющее слово 0.8, синоним уточняющего слова 0.7, а, допустим, наименование марки изделия - 2.5. Все наименования-кандидаты упорядочиваются в порядке убывания значения критерия и в таком виде предлагаются пользователю для окончательного выбора.

В системе ASIS® поиск близких по смыслу наименований производится в базах аналогов машин и оборудования, а также классификатора ОКОФ.

Для ускорения поиска предварительно выполняется разбор всех наименований в каждой базе аналогов. Результаты этого разбора хранятся в специальных файлах и содержат не сами слова, а их коды в виде ссылок на записи словаря слов системы ASIS®. Аналогичный файл результатов разбора составляется и для наименований классов классификатора ОКОФ.

5. В заключение о мощности русского языка.

Интенсивную работу над словарем-справочником планируется закончить примерно к концу 2014 года. По прогнозам автора словаря в нём будет около 545 тыс. слов и выражений, из которых примерно 415 тысяч будут снабжены синонимами, квазисинонимами, поясняющими словами (сходными по смыслу выражениями). Всего синонимических связей будет около 1950 тыс. (за вычетом задвоенных с буквой «ё» будет около 525 тыс. слов и словосочетаний, и 1925 тыс. связей). По-видимому, цифры 455 тыс. уникальных слов (без дублирования форм глаголов и слов с буквой Ё и учёта фразеологизмов), 1630 тыс. синонимических связей примерно и характеризуют «мощность» словарного состава русского языка, не считая сокращений и многочисленных топонимов для некрупных объектов, однако я не нашёл данных о работах по реальному сравнению «мощности» и «разветвлённости» различных языков. Именно выявление этих цифр было одной из главных задач создания данного словаря. Приводящиеся в популяризаторских книгах данные о суммарном количестве слов в различных языках, как правило, документально не подтверждаются их авторами (см., например, книгу «Рекорды Гинесса»). Заметим, что в замечательной книге Льва Успенского «Слово о словах» (1971 г., 5-е издание) отмечается, что, «Сотрудники словарного отдела (Института языкознания в Ленинграде) полагают, что ими зарегистрировано около 400 – 500 тысяч разных русских слов. Вероятно, в коллекции есть пропуски (она и сейчас непрерывно пополняется), но, в общем, цифра эта близка к исчерпывающей».

Кроме того, поэт Е. А. Евтушенко, сравнивая русский и английский языки, высказал мнение, что «в английском нет столько рифм, сколько у нас и приходится рифмованный стих в связи с израсходованностью рифм на английский переводить без рифмы», см. http://www.echo.msk.ru/programs/beseda/43457/.

По мнению писателя Саши Соколова: «Английский не так пластичен, не обладает свободой русского — Тургенев был совершенно прав. Русский инверсивен, фраза строится без всяких там… Всё можно переиначить, начать с любого слова. А в английском нельзя слишком вольничать. Ещё русский народ каким-то образом — может, в силу лености своей? — избавился от частиц и артиклей. Лишнего в языке нет. Насколько загадочней получается язык, когда убирается артикль! Ты говоришь не об одном предмете, а о целом их ряде. Я говорил и с австрийскими, и с немецкими филологами о русском языке. Они такие аккуратисты, их раздражает и коробит в русском неопределённость, размытость описаний, диалогов. А мне это очень легло на душу. У народа, который никогда не стремился к внешней свободе, есть внутренняя, даже какая-то анархия. По тому, как устроен язык, можно судить о народе, о степени его изобретательности», см. http://www.chaskor.ru/article/sasha_sokolov_sily_eshche_est_grebu_ya_horosho_11971 .

Таким образом, с помощью языка человек познаёт мир, и от языка зависит, как именно человек познаёт, видит мир и как он мыслит. Именно язык народа во многом определяет менталитет народа, его национальные ценности и особенности наряду с религией, территорией обитания и т.д.

Обновление версий словаря на сайте http://www.trishin.ru в ближайший год планируется производить один раз в полгода, в дальнейшем обновление словаря будет происходить раз в несколько лет.

В следующей версии электронного словаря версии 8.4 для облегчения изучения работы программы пользователями-иностранцами (осваивающих русский язык) планируется дополнительно переписать интерфейс программы и встроенное руководство пользователя на 7-9 иностранных языках (английском, французском, немецком, испанском и др.), с тем чтобы в зависимости от установленного при загрузке компьютера языка, этот же язык выбирался для интерфейса и встроенного руководства словаря-справочника. Скриншот готового словаря на 4-е языка приведён в Приложении.

Ссылки на синонимы в словаре начиная с версии 6.3 закодированы в качестве защиты от недобросовестных пользователей, а таких в Интернете немало, разместивших его на своих сайтах без указания автора. Например, если поискать в Google ошибочное словосочетание «без возграждения» (вместо «без вознаграждения») - будет 710 ссылок (на дату 24.09.2013). Эта ошибка была допущена в размещенной на нашем сайте до 2010 года незашифрованной версии словаря. Не случайно ни количество слов, ни количество синонимов в этих словарях не указано. Цель большинства этих «лексикографов» - увеличить число посетителей своих сайтов, на которых рекламируются разные товары и услуги, вплоть до порнографии.

И этот последний открытый словарь 2010 года версии 6.2 на 383 тыс. слов стал слишком (в нём, к сожалению, много опечаток), по моему мнению, популярен в интернете по сравнению с новыми версиями этого же словаря да и другими словарями. Например, запрос на дату 24.09.2013 в Google.com «Словарь»+«Тришин»+«2010» даёт 2,04 млн. ссылок на словарь. Для сравнения укажем данные по другим, неоднократно переиздаваемым словарям русского языка (кроме многотомного Большого академического словаря), упоминаемым в статье Википедии как якобы крупнейшие словари русского языка (http://ru.wikipedia.org/wiki/%D0%A1%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D0%B8_%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0) по им соответствующим запросам:

1) «Словарь»+«Даль» - 5,49 млн. ссылок (около 200000 слов).
2) «Словарь»+«Лопатин» - 1,67 млн. ссылок (около 200000 слов).
3) «Сводный»+«словарь»+ «лексики» - 1,27 млн. ссылок (около 170000 слов).
4) «Словарь»+«Ефремова» - 3,96 млн. ссылок (около 160000 слов).
5) «Словарь»+«Тихонов» - 0,274 млн. ссылок (около 145000 слов).
6) «Словарь»+«Кузнецов» - 2,21 млн. ссылок (около 130000 слов).
7) «Большой»+«академический»+«словарь» - 3,29 млн. ссылок (около 120000 слов).
8) «Словарь»+«Ушаков» - 4,14 млн. ссылок (около 90000 слов).
9) «Словарь»+«Ожегов» - 2,87 млн. ссылок (около 50000 слов).

Данный словарь-справочник в этой статье не указан, а в статье Википедии о словарях синонимов почему-то указана очень старая версия данного словаря на 163 тыс. слов кем-то анонимно размещённая в Интернете в 2003 году вместо современной, см. http://ru.wikisource.org/wiki/%D0%A1%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C_%D1%81%D0%B8%D0%BD%D0%BE%D0%BD%D0%B8%D0%BC%D0%BE%D0%B2

Надеюсь, что эти недоразумения в Википедии будут исправлены.

Автор словаря награжден за его создание несколькими общественными наградами.

6. Выводы.

  • Наличие такого словаря практически доказывает, что русский язык является одним из самых мощных языков мира.
  • На сегодняшний день данный словарь, реализованный в виде компьютерной базы данных, является самым большим словарём русского языка как по количеству слов, так и по количеству синонимических связей.
  • Он пополнялся вручную около 20 лет его автором на основе как изданных словарей, справочников и энциклопедий, так и других источников (газет, журналов, Интернет и др.) .
  • Этот компьютерный словарь позволяет производить практически любые запросы к словарному составу и осуществлять различные лингвистические эксперименты. 

7. Публикации о словаре.

  • С.Голубицкий «Побочный продукт», компьютерный еженедельник «Компьютерра», №26-27, 2004, http://offline.computerra.ru/2004/550/34752/ .
  • С.Голубицкий «Морфинг», компьютерный еженедельник «Компьютерра», №29-30, 2004.
  • С.Костырко «WWW-обозрение», журнал «Новый мир», №9, 2005.
  • В.Н.Тришин «Электронный словарь-справочник синонимов русского языка системы ASIS» в книге «Владимир Даль в счастливом доме на Пресне», М.: изд-во «Academia», 2010, стр. 158-165.

8. Дополнительная литература о русском языке.

  • Линниченко И.А. «Труды подготовительной по национальным делам комиссии. Малорусский отдел». – Одесса: тип. Изд. «Русская культура», 1919. – Вып. 1: Сборник статей по малорусскому вопросу. – 119 стр.
  • Флоринский Т.Д. «Лекция по славянскому языкознанию», ч. 1, Киев, 1895, ч. 2, СПБ, 1896.
  • Ляпунов Б.М. «Единство русского языка в его наречиях». – Одесса, 1919.
  • Будилович А.С. «О единстве русского народа». – СПб., 1907.

Приложение.

А) Скриншот словаря-справочника версии 6.8 на Fox Pro

Б) Скриншот словаря-справочника версии 8.3 (8.4) на С# с интерфейсом и помощью на 4-х языках

Поделиться ссылкой в социальных сетях:


Комментарии к материалу: (пока комментариев нет)

4956


Авторизация
Логин:
Пароль:
Регистрация
Забыли пароль?
Полезное
ФЗ N135 Об оцен. деят-сти
ФСО N1 общие понятия
ФСО N2 цели оценки
ФСО N3 требования к отчету
ФСО N4 кадастровая оценка
ФСО N5 экспертиза отчетов
ФСО N6 уровень знаний эксперта СРО
ФСО N7 Оценка недвижимости
ФСО N8 Оценка бизнеса
ФСО N9 Оценка для залога
ФСО N10 Оценка машин
ФСО N11 Оценка НМА
ФСО N12 Ликвидационная
ФСО N13 Инвестиционная
Земельный кодекс РФ
Индикаторы
Курсы валютс 24/09с 25/09
USD ЦБ72,7245 73,00811
EURO ЦБ85,2040 85,68230
Индекс стоимости жилья
2490 $/кв.м.   Данные IRN.ru

Индексы СМР IV кв.2020, письмо № 47349-ИФ/09
Индексы СМР IV кв.2020, письмо № 45484-ИФ/09
Индексы СМР IV кв.2020, письмо № 44016-ИФ/09
Индексы ПИР IV кв.2020
Индексы СМР (VI)
Индексы СМР III кв.2020 (V)
Индексы СМР III кв.2020 (IV)
Индексы СМР III кв.2020 (III)
Индексы СМР III кв.2020 (II)
Индексы СМР III кв.2020 (I)
Индексы СМР, индексы изменения ПИР с 1998
Рекомендуем
Онлайн оценка квартиры
Онлайн-оценка автомобиля
Калькулятор физического износа
ВСН 53-86(р) | ВСН 58-88(р)
Наши партнеры
Лист рассылки
Подписка на лист рассылки Оценщик.ру: Новости из мира оценки и нашего сервера
Вакансии
Требуется Оценщик недвижимости
Поиск по сайту
Аплайн оценка

Новости | Работа : Вакансии | Работа : Резюме | Методики | Словарь | Обзоры | СРО
Отчеты об оценке | Справочники | Форум | Интервью | Рейтинги | Сметный портал | Частный бухгалтер
Интервью | Наследование | Контакты | Оценка собственности | Английский бесплатно
Скорость интернета | Советы Туристам
Рейтинг@Mail.ru