Сибирский филологический журнал | Журналы | Институт филологии СО РАН
главная об институте документы вакансии противодействие коррупции
журналы научные труды конференции электронные ресурсы контакты
Федеральное государственное бюджетное учреждение науки
Институт филологии Сибирского отделения Российской академии наук
(ИФЛ СО РАН)
ENG
 Журналы
Сибирский филологический журнал — главная
In English
Архив выпусков
Редколлегия и редакционный совет
Издательская этика
Требования к оформлению материалов
Порядок приёма и публикации статей
Список замеченных опечаток
Поиск по материалам:

Автор:

и/или ключевое слово:

Адрес редакции: 630090, г. Новосибирск, ул. Николаева, 8. Институт филологии СО РАН.

Статья

Название: Что и как может получить лингвист из оцифрованных текстов

Авторы: В. И. Беликов

В рубрике Языкознание

Выпуск 3, 2016Страницы 17-34
УДК: 811.161.1, 81’33DOI: 10.17223/18137083/56/2

Аннотация: Статья посвящена границам применимости онлайн-инструментов автоматической обработки цифровых текстов (поисковых машин, языковых корпусов, Google Books Ngram Viewer) в лингвостатистических исследованиях. Вопреки установившемуся мнению об объективности результатов, получаемых после автоматической обработки текстового массива, существуют ограничения и искажения данных, обусловленные множеством причин. Одной из них является частое отсутствие лингвистов в коллективах разработчиков таких автоматов. На примере анализа частотности употребления культурно значимых онимов и их орфографических вариантов, родовых форм глаголов и вариантов предложного управления по данным разных автоматических средств анализа текстов показана сложность лингвистической интерпретации результатов автоматической обработки текстовых массивов.

Ключевые слова: цифровой текст, лингвистическая статистика, онлайн-инструменты лингвистической обработки текстов, корпусная лингвистика, грамматическая вариантность

Список использованной литературы:

Беликов В. И. Интернет и орфография // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. конф. «Диалог’2003». М.: Наука, 2003.

Беликов В. И. Yandex как лексикографический инструмент // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. конф. «Диалог’ 2004». М.: Наука, 2004.

Беликов В. И. Словарь «Языки русских городов»: подбор примеров и Интернет // Компьютерная лингвистика и интеллектуальные технологии: Тр. Междунар. конф. «Диалог 2006». М.: ИПИ РАН, 2006.

Беликов В. И. К методике корпусного исследования лексики // Русский язык и новые технологии. М.: НЛО, 2014.

Беликов В. И., Копылов Н. Ю., Пиперски А. Ч., Селегей В. П., Шаров С. А. Корпус как язык: от масштабируемости к дифференциальной полноте // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегод. Междунар. конф. «Диалог». Вып. 12(19). Т. 1. М.: РГГУ, 2013.

Кронгауз М. А. Самоучитель олбанского. М.: АСТ, 2013.

Кузнецов С. А. Языковая норма и правила речевой деятельности // Комментарий к Федеральному закону «О государственном языке Российской Федерации». Ч. 1: Доктринальный и нормативно-правовой комментарий. СПб.: Изд-во С.-Петерб. ун-та, 2009.

МАС: Словарь русского языка: В 4 т. / Под ред. А. П. Евгеньевой. 2-е изд., испр. и доп. М.: Рус. яз., 1981–1984.

Труды международной конференции «Корпусная лингвистика – 2015». СПб.: СПбГУ, 2015.

Щерба Л. В. О трояком аспекте языковых явлений и об эксперименте в языкознании // Языковая система и речевая деятельность. Л.: Наука, 1974.

Эпштейн М. Н. Слово недели: нумеризм // Дар слова. Проективный лексикон Михаила Эпштейна. 2003. № 71(111). 8 сент. URL: http://www.emory.edu/ INTELNET/dar71.html

Эпштейн М. Н. Мысли в числах: Америка и Россия в зеркалах интернета // Философский век: Альм. Вып. 32: Бенджамин Франклин и Россия: к 300-летию со дня рождения. Ч. 2. СПб.: Центр истории идей, 2006.

Язык и мысль: Современная когнитивная лингвистика. М.: ЯСК, 2015.

ИФЛ СО РАН
630090, Новосибирск, ул. Николаева, 8
тел./факс: 8-(383)330-15-18, ifl@philology.nsc.ru
Карта сайта


Дизайн © ИФЛ СО РАН