Поиск по тегу "лингвистика"

Лекция из цикла "Компьютерная лингвистика"

В написанном в конце прошлого века учебнике социолингвистики говорилось, что дневниковые записи «среднестатистических» носителей языка представляют для исследователей языка исключительно интересный, но труднодоступный материал. Широкое распространение блогосферы дало неограниченные возможности для компьютерного анализа подобных текстов. Лингвисты могут работать с повседневными записями, авторы которых легко классифицируются по важнейшим социолингвистическим параметрам. Теперь несложно получить объективные данные о языке мужчин и женщин, подростков и лиц старших возрастов в любом регионе, стала доступной статистика языковых изменений за последнее десятилетие.
Комментариев: 0
Лекция из цикла "Компьютерная лингвистика"

История машинного перевода – перевода текстов с одного языка на другой с помощью компьютера – насчитывает без малого шестьдесят лет. За это время сменилось несколько поколений систем машинного перевода: от почти игрушечных моделей, переводивших текст слово за словом без учета контекста, ученые перешли к сложным системам, создавая правила, учитывающие тонкие смысловые оттенки переводимого текста. Наряду с системами перевода, основанными на правилах, стали создаваться «статистические» системы, обращающиеся к сверхбольшим корпусам параллельных текстов и находящие в них наилучшие эквиваленты для как можно более крупных фрагментов переводимого текста. В дополнение к системам перевода письменных текстов приобретают все более широкое распространение системы устного перевода, распознающие живую речь на входном языке и синтезирующие звучащий текст на выходном языке, мало отличающийся от человеческой речи. В истории машинного перевода были свои взлеты и падения: энтузиазм первопроходцев сменялся глубоким пессимизмом, когда видные специалисты приходили к убеждению, что задача машинного перевода не может быть решена в обозримом будущем. Сейчас машинный перевод переживает второе рождение: благодаря сочетанию различных методов и подходов качество перевода заметно улучшается и в эту область вовлекаются все новые языки.
Комментариев: 0
Лекторы: Иомдин Леонид
Лекция из цикла "Компьютерная лингвистика"

Определение тематики текста является достаточно простой задачей (так, например, Яндекс.Новости определяет сюжеты новостей по совпадению ключевых слов). В то же время жанр текста, характеристики его автора (например, пол, возраст) не зависят прямо от ключевых слов, поскольку текст в одном и том же жанре или одного и того же автора может быть написан на разные темы. В лекции рассматриваются подходы к автоматическому определению этих характеристик
Комментариев: 0
Лекторы: Шаров Сергей
Лекция из цикла "Компьютерная лингвистика"

Суперкомпьютер IBM Watson стал результатом многолетней работы инженеров IBM с амбициозной целью - создание системы, способной соперничать с человеком в его возможности понимать и отвечать на вопросы, заданные на естественном языке. На сегодняшний день требования к точности и скорости нахождения ответов делают Watson уникальной среди других вопросно-ответных систем. Лекция будет посвящена тому, что предшествовало созданию системы, какие технологии были использованы при ее разработке, а также будут рассмотрены возможные области применения IBM Watson, включая задачи компьютерной лингвистики.
Комментариев: 0
Лекция из цикла "Компьютерная лингвистика"

Современные технологии не только меняют старые лингвистические инструменты (превращая, например, традиционные словари в компьютерные базы данных), но и создают новые. К таким новым лингвистическим ресурсам относятся корпуса текстов. Первые, небольшие корпуса появились во второй половине прошлого века, потом им на смену пришли крупные национальные корпуса и произвели революцию в лингвистике. Постепенно корпуса войдут и в жизнь обычных людей. Эта лекция -- о том, что такое корпус языка, национальный корпус, для чего они нам могут понадобиться и как пользоваться Национальным корпусом русского языка.
Комментариев: 0
Лекция из цикла "Компьютерная лингвистика"

Современный Интернет непредставим без поисковых систем (таких, как Яндекс, Google или Bing). За 20 с лишним лет их существования ожидания пользователей сильно возросли, и современный интернет-поиск требует гораздо более глубокого понимания естественных языков, нежели простой «поиск по ключевым словам». От поисковика требуется знание синонимов, устойчивых оборотов и онтологических рядов, умение понять запрос на одном естественном языке, но результаты найти на другом, и даже умение восстанавливать и учитывать желания пользователя, не указанные им в запросе явно.
Комментариев: 0
Лекторы: Плахов Андрей
Лекция из цикла "Компьютерная лингвистика"

За полвека существования компьютерная лингвистика переживала периоды больших надежд и таких же больших разочарований. Одним из усвоенных уроков стало понимание того, что компьютерная лингвистика и лингвистика теоретическая – это пусть очень тесно связанные, но все же разные науки. Пожалуй, нечто похожее произошло в области моделирования шахматной игры, когда выяснилось, что не всегда решать задачу на компьютере нужно так, как предположительно решает ее человек. Как будет развиваться компьютерная лингвистика, на что она способна сегодня, и что сможет завтра – об этом первая лекция цикла.
Комментариев: 0
Компьютерная лингвистика

Компьютерная лингвистика существует уже полвека, но только теперь ее плодами готовы пользоваться миллиарды. Задачи автоматического анализа текста, такие как машинный перевод, распознавание речи, информационный поиск стали актуальными с момента появления компьютера, но только технологическая революция, связавшая нашу жизнь с Интернетом и многочисленными мобильными коммуникационными устройствами, сформировала всеобщую потребность в языковых технологиях. Готова ли компьютерная лингвистика к этому вызову? В цикле лекций, организованной Институтом Лингвистики РГГУ и Политехническим музеем, о задачах компьютерной лингвистики расскажут те, кто уже достиг серьезных успехов в их решении: представители исследовательских и коммерческих проектов в области автоматической обработки естественного языка.

9 октября 19:00 Компьютерная лингвистика сегодня: от автоматической обработки текста до машинного понимания. Владимир Селегей.

За полвека существования компьютерная лингвистика переживала периоды больших надежд и таких же больших разочарований. Одним из усвоенных уроков стало понимание того, что компьютерная лингвистика и лингвистика теоретическая – это пусть очень тесно связанные, но все же разные науки. Пожалуй, нечто похожее произошло в области моделирования шахматной игры, когда выяснилось, что не всегда решать задачу на компьютере нужно так, как предположительно решает ее человек. Как будет развиваться компьютерная лингвистика, на что она способна сегодня, и что сможет завтра – об этом первая лекция цикла.

16 октября 19:00 Cистемы поиска в Интернете: как обрабатывается запрос пользователя. Андрей Плахов.

Современный интернет непредставим без поисковых систем (таких, как Яндекс, Google или Bing). За 20 с лишним лет их существования ожидания пользователей сильно возросли, и современный интернет-поиск требует гораздо более глубокого понимания естественных языков, нежели простой «поиск по ключевым словам». От поисковика требуется знание синонимов, устойчивых оборотов и онтологических рядов, умение понять запрос на одном естественном языке, но результаты найти на другом, и даже умение восстанавливать и учитывать желания пользователя, не указанные им в запросе явно.

23 октября 19:00 Национальный корпус Русского Языка: новые компьютерные ресурсы для лингвистов и нелингвистов. Екатерина Рахилина.

Современные технологии не только меняют старые лингвистические инструменты (превращая, например, традиционные словари в компьютерные базы данных), но и создают новые. К таким новым лингвистическим ресурсам относятся корпуса текстов. Первые, небольшие корпуса появились во второй половине прошлого века, потом им на смену пришли крупные национальные корпуса и произвели революцию в лингвистике. Постепенно корпуса войдут и в жизнь обычных людей. Эта лекция - о том, что такое корпус языка, национальный корпус, для чего они нам могут понадобиться и как пользоваться Национальным корпусом русского языка.

30 октября 19:00 IBM Watson: может ли компьютер отвечать на вопросы лучше человека. Екатерина Фроловичева и Артем Семенихин.

Суперкомпьютер IBM Watson стал результатом многолетней работы инженеров IBM с амбициозной целью - создание системы, способной соперничать с человеком в его возможности понимать и отвечать на вопросы, заданные на естественном языке. На сегодняшний день требования к точности и скорости нахождения ответов делают Watson уникальной среди других вопросно-ответных систем. Лекция будет посвящена тому, что предшествовало созданию системы, какие технологии были использованы при ее разработке, а также будут рассмотрены возможные области применения IBM Watson, включая задачи компьютерной лингвистики.

6 ноября 19:00 Компьютерный анализ жанра и характеристик автора текста. Сергей Шаров.

Определение тематики текста является достаточно простой задачей (так, например, Яндекс.Новости определяет сюжеты новостей по совпадению ключевых слов). В то же время жанр текста, характеристики его автора (например, пол, возраст) не зависят прямо от ключевых слов, поскольку текст в одном и том же жанре или одного и того же автора может быть написан на разные темы. В докладе рассматриваются подходы к автоматическому определению этих характеристик

13 ноября 19:00 Машинный перевод: успехи, неудачи, надежды. Леонид Иомдин.

История машинного перевода – перевода текстов с одного языка на другой с помощью компьютера – насчитывает без малого шестьдесят лет. За это время сменилось несколько поколений систем машинного перевода: от почти игрушечных моделей, переводивших текст слово за словом без учета контекста, ученые перешли к сложным системам, создавая правила, учитывающие тонкие смысловые оттенки переводимого текста. Наряду с системами перевода, основанными на правилах, стали создаваться «статистические» системы, обращающиеся к сверхбольшим корпусам параллельных текстов и находящие в них наилучшие эквиваленты для как можно более крупных фрагментов переводимого текста. В дополнение к системам перевода письменных текстов приобретают все более широкое распространение системы устного перевода, распознающие живую речь на входном языке и синтезирующие звучащий текст на выходном языке, мало отличающийся от человеческой речи. В истории машинного перевода были свои взлеты и падения: энтузиазм первопроходцев сменялся глубоким пессимизмом, когда видные специалисты приходили к убеждению, что задача машинного перевода не может быть решена в обозримом будущем. Сейчас машинный перевод переживает второе рождение: благодаря сочетанию различных методов и подходов качество перевода заметно улучшается и в эту область вовлекаются все новые языки.

20 ноября 19:00 Компьютерный анализ блогосферы как источник знаний о языке. Владимир Беликов

В написанном в конце прошлого века учебнике социолингвистики говорилось, что дневниковые записи «среднестатистических» носителей языка представляют для исследователей языка исключительно интересный, но труднодоступный материал. Широкое распространение блогосферы дало неограниченные возможности для компьютерного анализа подобных текстов. Лингвисты могут работать с повседневными записями, авторы которых легко классифицируются по важнейшим социолингвистическим параметрам. Теперь несложно получить объективные данные о языке мужчин и женщин, подростков и лиц старших возрастов в любом регионе, стала доступной статистика языковых изменений за последнее десятилетие.

27 ноября 19:00 Компьютерная лингвистика и семантическая паутина Интернета: откуда и куда мы идем.Владимир Хорошевский.

Лекция посвящена обсуждению 3-х тем: ретроспективному обзору методов и средств компьютерной лингвистики, которые в настоящее время активно используются при построении систем извлечения знаний из текстов; обсуждению концепции семантической паутины, которая постепенно трансформирует современный Интернет за счет формирования пространств знаний; сравнительному анализу существующих в данной области решений и результатов. Обсуждение сопровождается презентацией семантических порталов, функционирующих в Интернет, где уже используются системы обработки естественного языка.

4 декабря 19:00 Компьютер и словарь: незнакомцы, конкуренты, друзья? Борис Иомдин.

Когда-то толкования непонятных слов писали прямо на полях рукописей, потом стали собирать их в отдельные книги – словари, позже возникла целая наука лексикография. Лексикографы выписывали примеры употребления слов на карточки и составляли из них огромные картотеки – еще не так давно шкафы со словарными карточками стояли во всех коридорах Института русского языка. С появлением компьютеров карточки стали стремительно уходить в прошлое, а в последнее время они потянули за собой и словари. Все чаще люди просто смотрят значение слова в Википедии или вводят его в окошко онлайного машинного переводчика. Как повлиял компьютер на развитие лексикографии, ее материала, методов и практических результатов? Какие новые задачи ставит перед лексикографами развитие компьютеров и Интернета? И есть ли у словаря будущее в новую эпоху?

Вход на все лекции осуществляется через 9-ый подъезд Политехнического музея.

Стоимость полного билета 200 рублей, льготного - 100 рублей.
Комментариев: 0
Речь пойдет о смысле научного изучения языка.
Научным изучением языка занимается теоретическая лингвистика. Задачи - и даже само существование - такой науки до сих пор остаются для широкой публики почти неизвестными: чаще всего считается, что изучение языка сводится к умению говорить и писать на этом языке, а в случае родного языка -- к приобретению навыков "грамотной" письменной и устной речи. Между тем, теоретическая лингвистика имеет в виду совсем другое: ее следует отличать и от практического преподавания языка, и от традиционной филологии. Это одна из самых сложных и увлекательных областей современного гуманитарного знания, имеющая не такую уж короткую историю.

Лекция проходит в рамках премии "Просветитель", организованной фондом "Династия".
Комментариев: 1
Действительно ли каждый язык отражает особое видение мира? Отражает или формирует? Закрепленное в нашем языке представление о мире пришло из глубины веков и остается неизменным - или сформировалось не так давно и активно меняется? Кто меняет язык? Что изменилось в русском языке за последнее время?
Прольет свет на эти и другие вопросы кандидат филологических наук, старший научный сотрудник Института русского языка В.В.Виноградова РАН Ирина Левонтина.

Лекция проходит в рамках премии "Просветитель", организованной фондом "Династия".
Комментариев: 0
Лекторы расскажут о том, почему город представляет собой модель большой языковой экосистемы, об истории и способах изучения языка, о происхождении, жизни и смерти языков, и о многом другом.
Комментариев: 0
     Кавказ отличается разнообразием языков, народов, культур и религий – и как нет абстрактного лица кавказской национальности, так не существует и усредненного кавказского языка. В лекции рассказывается о полевой работе в Дагестане, об особенностях дагестанских языков и о том, как жители небольших дагестанских селений сохраняют свое лингвистическое и культурное своеобразие.
Комментариев: 0
        Даже сегодня, в XXI веке, удается найти русские говоры с архаическими древнерусскими чертами. Это важный и интересный материал для исследователей. Но не менее важны и интересны люди, которые живут в сложных условиях, далеко от принципов городского комфорта; те особые отношения малого мира деревни, особый менталитет тесного коллектива, где все – свои, где каждый достойный поступок и недостойное поведение – на виду.
Комментариев: 0
Лекторы: Исаев Игорь
       В самые последние десятилетия число языков на Земле заметно сократилось. Именно поэтому внимание лингвистов сосредоточено на языках, находящихся под угрозой исчезновения: организуются экспедиции для сбора языковых данных среди последних носителей языка, ведется работа по обработке и архивации лингвистических материалов, публикуются тексты на уже исчезнувших или исчезающих языках. Между тем, во все времена шел и продолжает идти процесс, противоположный исчезновению. В лекции рассказывается о том, как в результате тесных контактов между различными языками возникают новые языки, отличающиеся от языков-родителей в структурном и социолингвистическом отношении. Будут проанализированы причины и механизмы появления пиджинов, креольских и смешанных языков.
Комментариев: 0
        Языки и традиционные культуры автохтонного населения Сибири – это существенная часть нашего культурного наследия, национальное достояние нашей страны. О современном состоянии малых сибирских языков, их документации и возможных путях сохранения пойдет речь в лекции. В качестве иллюстрации будут показаны фото- и видеоматериалы лингвистических экспедиций к селькупам, кетам и эвенкам.
Комментариев: 0
       Долгие десятилетия советские/российские лингвисты-африканисты были похожи на специалистов по латыни или древнеегипетскому: изучать африканские языки приходилось больше по чужим описаниям и записям, чем в общении с теми, кто на них говорит. С 90-х годов прошлого века ситуация кардинально изменилась: теперь российские экспедиции для изучения больших и малых языков континента отправляются в Африку каждый год. Особое внимание уделяется языкам малоописанным, и полученные данные нередко радикально переворачивают сложившиеся представления о том, что бывает и чего не бывает в африканских языках.
Комментариев: 0
        Лекция посвящена истории и современному состоянию русских диалектов, на которых по настоящее время говорят старообрядцы Южной Америки, переселившиеся туда из Китая в конце 1950-х гг. Лекция сопровождается демонстрацией аудио-, фото- и видеоматериалов, собранных в диалектологических экспедициях под руководством О.Г. Ровновой в Бразилии, Аргентине, Уругвае, Боливии.
Комментариев: 0
Лекторы: Ровнова Ольга
       Японцы по сравнению с другими народами отличаются повышенным вниманием к своему языку и к его социальным и культурным функциям. Японский язык не имеет близкородственных языков, территория его распространения и этнический состав его носителей стабильны в течение многих веков, при огромном влиянии на Японию культуры Китая, а затем Запада, язык, несмотря на большое число заимствований – один из немногих исконных компонентов японской культуры. В Японии до сих пор очень сильно представление о своём языке как об особом достоянии, естественно присущем всем японцам и недоступном или труднодоступном для иностранцев. Заимствованные из китайского и английского языков единицы количественно значительны, но функционально маркированы: китаизмы связаны с книжной культурой и наукой, американизмы – со сферами престижного потребления и высоких технологий. Японский национализм имеет ярко выраженную языковую составляющую. В то же время культурное влияние Китая, из которого пришла иероглифическая письменность, отразилось в особом значении, придаваемом в японской культуре письменной речи. Особенностями японского языка являются так называемые формы вежливости (точнее, формы этикета) и особые гендерные разновидности языка; то и другое играет важную роль в японской языковой культуре. Японская языковая картина мира, безусловно, имеет значительную специфику, однако этот вопрос, в последние десятилетия активно разрабатываемый, во многом остаётся неясным из-за отсутствия строгих научных методов.
Комментариев: 0
       На Земле порядка 6,5 тысяч различных языков. Некоторые из них насчитывают миллионы говорящих, другие – десятки говорящих; некоторые имеют давние и богатые литературные традиции, другие не имеют даже письменностей. При этом постоянно приходится читать и слышать, что «такой-то язык стремительно исчезает», и что это плохо, поскольку с исчезновением языка исчезает и народ, говоривший на нем, и таким образом теряется языковое и культурное разнообразие. В лекции рассматривается эта проблематика, известная в науке под именем «языкового сдвига», и показывается, что процессы «исчезновения» языков значительно сложнее (и интереснее), чем простое арифметическое вычитание.
Комментариев: 0
        В лекции пойдет речь о двух проектах по изучению языков Аляски. Первый из них связан с одним из коренных языков Аляски, принадлежащим к атабаскской языковой семье. Это язык очень маленькой этнической группы, верхнекускоквимцев, проживающей во внутренней части Аляски. Будут затронуты такие вопросы, как специфика полевой работы среди аборигенов арктического региона, социолингвистическая ситуация, русские заимствования, сохранившиеся со времен Русской Америки. Второй проект посвящен изучению русского диалекта, возникшего на Аляске в 19 веке и существующего по настоящее время в деревне Нинильчик на полуострове Кенай и в ряде других мест. В частности, речь пойдет о специфике звукового строя этого реликтового русского диалекта, об особенностях словаря и грамматики.
Комментариев: 1
Лекторы: Кибрик Андрей