Компьютерная лингвистика в «Вышке»: Анастасия Бонч-Осмоловская о новой магистерской программе. Где в России обучают компьютерной лингвистике? Компьютерная лингвистика курсы

Культурно-просветительский центр «Архэ» приглашает на курс лекций Александра Чедовича Пиперски «Компьютерная лингвистика».

Тема первой лекции: «Основные задачи компьютерной лингвистики и подходы к их решению».

Машинный перевод, проверка орфографии, классификация текстов, распознавание речи и многое другое: всё это - задачи компьютерной лингвистики. Решать их можно разными способами: или пытаясь имитировать то, как с языком работает человек, или надеяться, что со всем удастся справиться за счёт больших данных. Но естественный язык нелегко обрабатывать автоматически, и на этом пути нас подстерегает много сложностей. В число проблем входит омонимия (когда одно и то же слово называет разные вещи), синонимия (когда, наоборот, одно и то же называется разными словами) и другие свойства человеческих языков, на которые мы в обычной жизни даже не обращаем внимания.

О лекторе:
, кандидат филологических наук, доцент Института лингвистики РГГУ, научный сотрудник Школы филологии НИУ ВШЭ, автор книги «Конструирование языков» (Альпина Нон-фикшн, 2017).

О курсе лекций «Компьютерная лингвистика»:

Компьютерная лингвистика - одна из наиболее динамично развивающихся областей на стыке теории и практики. С достижениями компьютерной лингвистики мы сталкиваемся каждый день: это и машинный перевод, и поиск в Интернете, и голосовые помощники, и многое другое. За каждым таким продуктом стоит серьёзная работа лингвистов и программистов. В ходе курса мы поговорим об истории компьютерной лингвистики и о наиболее популярных её методах, а также посмотрим, как они позволяют решать важные практические задачи: например, проверять орфографию или классифицировать по темам новости.

Итак, компьютерная лингвистика - молодая, но очень перспективная наука. А главная особенность этой науки в том, что она считается междисциплинарной, то есть изучает проблемы, стоящие на стыке программирования и языкознания. И для того, чтобы стать полноценным специалистом в этой области, нужно хорошо разбираться и в математике и в лингвистике.

Программы обучения делятся на программы для филологов, которые хотят связать свою жизнь с лингвистическими разработками в IT, и для математиков, желающих работать над системами распознавания текста, переводческими программами и т.д. Мы остановимся на втором варианте.

Сразу хочу оговориться, что таких магистратур в России - единицы, и обычно они курируются компаниями, занимающимися лингвистическими разработками. Большинство программ, посвященных компьютерной лингвистике, находится в столицах.

Начну с той магистратуры, которая показалась мне самой интересной. Она находится в Санкт-Петербурге, на базе СПбГУ на кафедре информационных систем в искусстве и гуманитарных науках. Хочу сразу отметить, что кафедра находится на гуманитарном факультете, но рассчитана именно на программистов. Образовательная программа называется «Инженерия гуманитарных знаний». Целевая установка магистратуры - (цитирую сайт) «подготовка специалистов, способных участвовать в исследовательской и проектной работе в области интеллектуальных информационных технологий со специализацией в направлении языковой инженерии, технологий извлечения гуманитарных знаний из текстового потока, онтологической инженерии».

Чтобы туда поступить, требуется сдать письменный тест, в котором будут вопросы по математике, основам программирования и (немножко) по языкознанию. Пугаться вопросов по последней дисциплине математикам не стоит: судя по списку литературы, двух-трех несложных книг, озаглавленных «Введению в языкознание», вполне хватит, чтобы сдать вступительные испытания. Из собственных источников мне стало известно, что курирует эту образовательную программу компания Яндекс, правда на сайте магистратуры об этом не упоминается.

Вторая магистратура, о которой бы хотелось рассказать, находится в Москве на кафедре распознавания изображений и обработки текста факультета инноваций и высоких технологий (ФИВТ) в МФТИ. Она была основана в 2006 году компанией ABBYY. Судя по описанию, из нескольких программ магистратуры, предлагаемых этой кафедрой, к компьютерной лингвистике больше всего относятся направления «Интеллектуальные системы» и «Методы машинного обучения». Чтобы попасть туда учиться, нужно не только сдать вступительный экзамен, но и пройти собеседование с сотрудниками компании ABBYY. Все-таки в ABBYY рассчитывают, что потом выпускники пойдут работать к ним.

И последняя магистерская программа, о которой я поведаю, так и называется «Компьютерная лингвистика» и находится на факультете филологии ВШЭ. Как следует из добытой мной информации, она есть в Москве и в Нижегородском отделении Вышки. Представители университета считают, что эта программа подходит не только для математиков, но и для выпускников с другим базовым образованием. Обучение предполагает как курсы по программированию, призванные подтянуть выпускников гуманитарных специальностей, так и курс общей лингвистики, рассчитанной на математиков.

Чтобы поступить в эту магистратуру, нужно сдать экзамен по иностранному языку и оформить портфолио, в котором должно быть мотивационное письмо и информация о будущем студенте. Нужно будет рассказать о своих профессиональных интересах, публикациях, практиках, которые проходил и т.д. Преподавателями будут сотрудники факультета филологии, общеуниверситетской кафедры высшей математики, отделения прикладной математики и информатики, базовой кафедры Яндекса.

В общем, выбор у выпускников, которые решат заниматься компьютерной лингвистикой, есть. Пока он невелик, но, думаю, в будущем таких программ станет намного больше.

Думаю, на этом закончить свой обзор.
За помощь в подготовки статью благодарю Яндекс и Гугл, официальный сайт компании ABBYY, а также сайты вузов, о которых шла речь в посте.

Русские во Франции. Впечатления о студенческой стажировке.

Доброй традицией становятся майские стажировки студентов ФИЯР в Центре прикладной лингвистики Университета Франш-Контэ в г. Безансоне (Франция). На две первые недели месяца наши студенты вливаются в многонациональную компанию стажеров, насчитывающую ежегодно более трех тысяч человек.

Один из старейших центров обучения иностранным языкам осуществляет преподавание не только французского языка как иностранного, но и десятка других языков. В Центре повышают квалификацию преподаватели высшей и средней школы, на его базе проводятся различные научные исследования. По заказу министерств иностранных дел, посольств, министерств образования и других образовательных и культурных учреждений специалисты Центра отправляются в командировки и проводят свою работу на местах. Чуть больше года назад, 28 марта 2007 года, министерская комиссия, состоящая из представителей Министерства национального образования, Министерства культуры и коммуникации, а также Министерства иностранных дел, присудила Центру прикладной лингвистики особый знак качества (label FLE) - высший балл по пяти категориям - за заслуги в области преподавания французского языка как иностранного.

В этом году наш партнер празднует свой 50-летний юбилей. Празднует с размахом, объединяя сотрудников Центра; стажеров; партнеров, среди которых администрации города, департамента, региона, телевизионный канал ТВ 5, журнал «Французский язык в мире». Как гласит один из слоганов «...ведь языки связывают и объединяют Людей, Культуры, Страны, Проекты, Надежды... Именно это идея станет нашей красной нитью». Все формы выражения приветствуются на празднествах - речь, письмо, поэзия, графика, звук, видео. Нашей группе выдалась возможность побывать на одном из мероприятий, открывающих юбилейный марафон: вернисаж работ лицеистов, посвященных Центру прикладной лингвистики.

Это пребывание было богато на праздники и выходные, но эти дни никак нельзя назвать потерянными. Поездки в Париж, Лион, Дижон, Бон; участие в ежегодном международном фестивале университетских музыкальных коллективов в Бельфоре; посещение средневекового замка Жу, прогулка на речном трамвайчике до водопада на реке Ду с сытным обедом из местных блюд в деревенском ресторанчике: сырное фондю из нескольких сортов конте, различные копчености - гордость региона, уникальное желтое вино и восхитительный домашний пирог. Эрве Леш, руководить отдела внеклассных мероприятий, предложил яркую и насыщенную программу. Не были лишены внимания достопримечательности Безансона: его музеи, крепость, улочки, дома, фонтаны. Благодаря нашему гиду - преподавателю Центра Ф. Уабьяну - мы увидели город изнутри.

Будни оказались не менее насыщенными: 40 часов плодотворной работы под руководством профессионалов Центра прикладной лингвистики Николь Пуарье и Жан-Луи Кордонье с использованием мультимедийных средств, аудио и видео опор, текстов различных жанров, а главное - в аутентичной языковой среде. Познавательной была встреча с представителем городской администрации, сотрудником отдела по туризму, культуре и спорту Ш. Дюфэтр.

Поддержка кураторов группы А-М. Стимпфлинг, М. Лакая и Ж-П Беша особенно ценна. Ведь, благодаря их работе, программа пребывания наших студентов была отлично организована, нас окружала замечательная атмосфера, а впечатления были самыми приятными.

Сопровождающая группы О. Крюкова

Алиева Айсель

В конце зимы нам предложили поехать на стажировку в Безансон. После недолгих раздумий все согласились. Так, первого мая мы прилетели в Париж, откуда потом отправились в столицу региона Франш-Контэ.

Первое, что поразило меня в Безансоне, это его необыкновенная природа. Цветы, деревья, птицы - то, чем город может гордиться. Именно яркие солнечные лучи и пение птиц служили мне будильником по утрам. Также стоит отметить тот факт, что нам очень повезло с погодой. За 14 дней пребывания во Франции дождь шел только один раз. Кстати, именно в этот дождливый день мы поехали на экскурсию к водопадам на речном трамвае. Все население Безансона очень приветливое. У всех на лице сверкает улыбка, каждый готов помочь в случае необходимости.

Что касается нашего учебного процесса, то он был организован очень хорошо. Прежде всего, учитывались желания самих студентов. Так, программа обучения была направлена на развитие устной речи, изложение прочитанных текстов/статей. Сразу было видно, что преподаватели университета стремились сделать занятия как можно более интересными и полезными. Помимо учебы мы посетили замок (Château de Joux), музыкальный фестиваль в Бельфоре, съездили в Дижон и Бон. Так что познавательная часть нашей программы также была насыщенной. В последний день учебы мы были приглашены в отдел культуры и спорта городской администрации, где нам рассказали подробно о разных аспектах развития города: административное устройство, экономика, транспорт, культура, туризм, спорт…

Вот так прошла наша стажировка в Безансоне, одном из самых милых городов Франции. Было много всего интересного, но все описать на бумаге невозможно. Но могу точно сказать, что в каждом из нас остались свои яркие воспоминания о Безансоне. Все мы будем вспоминать о нашей практике с большим удовольствием, и фотоаппарат нам в этом поможет.
Дина Свирцова

Впечатления от поездки у меня остались только положительные.

Во-первых, мы смогли пообщаться по-французски на бытовом уровне, что невозможно было бы сделать во время занятий в университете. Поэтому поездка была очень полезна в плане практики языка, и благодаря ей мне стало намного легче говорить по-французски.

Во-вторых, мы посетили множество интересных мест, таких как Дижон - необычайно красивый город с множеством достопримечательностей, и где столько зелени…
Еще запомнилась поездка в замок «Chateau de Joux» - настоящий средневековый замок с толстыми стенами, огромной винтовой лестницей и холодным подземельем.

Затем мы отправились в ресторан, где попробовали фирменные блюда этого региона: фондю, колбасные изделия и, конечно, желтое вино.

Сильное впечатление на меня произвела прогулка по реке Ду, буквально в ста метрах от Швейцарии…

Что касается самого Безансона, это очень милый и красивый городок, по которому можно бесконечно гулять, любоваться видами и достопримечательностями…

В общем и целом, поездка оставила множество хороших впечатлений и положительных эмоций.
Кузнецова Марина

Узнав, что у нас есть возможность отправиться на практику во Францию, наша группа жила одними лишь мечтами и надеждами. В феврале идея о том, что в мае нас ждет путешествие, казалась какой-то нереальной и далекой, но мечты сбываются и voilà мы уже в Безансоне. Первое впечатление об этом городе: «Боже, какая тут природа, какие деревья, цветы. Все цветет!». С первого же дня, несмотря на усталость, хотелось гулять. На мой взгляд, невозможно описать чувства, которые мы испытывали все эти две недели. Бесконечный восторг и желание забыть, что ты иностранец и турист, слиться с толпой горожан и почувствовать себя частью города; стараться вести себя как французский студент: покупать билеты на автобус и на поезд, заходить в булочные и наслаждаться запахом свежеиспеченного хлеба, быть вежливым с людьми, которые тебя окружают.

Дни летели со скоростью света. И вот, нам уже пора собирать чемоданы и уезжать в Россию. Двойственное чувство: конечно, все мы соскучились по своим близким, но все же, я уверена, что каждый из нас остался бы тут еще. Покидать место, где единственной проблемой является нехватка времени на то, чтобы увидеть и посетить все, не хочется, ведь в Москве нас ожидают повседневные проблемы и летняя сессия. Безансон - очень спокойный и тихий город, здесь я чувствовала себя как на курорте, особенно это ощущалось ранним утром, когда солнце освещало улицы и деревья.

Но все же мы были на практике, поэтому приходилось не только отдыхать и развлекаться, но и серьезно заниматься. Наши преподаватели были очень внимательными, они всегда были готовы нам помочь, чувствовалась их заинтересованность в том, чтобы научить нас чему-то новому. Ко всему прочему, пополнился и наш словарный запас, т.к. часто мы находились в достаточно сложных ситуациях, выход из которых найти без знания некоторых понятий было очень сложно, но мы всегда справлялись!

Это очень приятно! Получаешь нереальное удовольствие, когда произносишь что-то на французском и видишь, что люди тебя понимают. Сразу появляется желание говорить на французском со всеми.

В завершение я хочу сказать, что практика в Безансоне помогла мне выучить много новых выражений, почувствовать себя причастной к повседневной жизни города, побороть в себе стеснительность и начать общаться и, конечно, все мы, по приезде в Москву, будем показывать своим родителям и друзьям фотографии и рассказывать о нашем путешествии. Куча воспоминаний, которые очень не хочется забывать!

Надеюсь, что в следующем году у нас будет еще одна возможность посетить Францию. А теперь, в Москве, нам стоит старательно заниматься и совершенствовать наши знания.

Я хочу сказать огромное спасибо тем, кто воплотил наши мечты в реальность и организовал эту замечательную двухнедельную поездку в один из самых, на мой взгляд, красивых и уютных городов Франции, а именно, в город Безансон.
Крюкова Нина

Для меня это первое путешествие во Францию - исполнение детской мечты, наконец-то сбывшийся сон.

Старинные мостовые города, солнце в брызгах фонтанов, которых в Безансоне очень много, черепичные крыши домов, зеленые холмы, старинная (и вечная, как пишут в буклетах) цитадель, построенная Великим Вобаном и хранящая память о минувших веках и войнах - все это настолько прекрасно, что кажется сном. Ты идешь по городу и думаешь, что сейчас проснешься, потому что не может быть на свете такой красоты и такого волшебства. Оказывается, может.

В этом городе на одной площади в одном доме родились братья Люмьер и Шарль Надье, а в доме напротив - Виктор Гюго. Над этой площадью возвышается на самая цитадель, и солнце играет бликами на разноцветной крыше кафедрального собора. Здесь история сплелась с современностью, и кажется, что у Безансона особые отношения с вечностью, ведь музей Времени находится именно там.

Помимо уроков в Центре прикладной лингвистики (CLA), на которых время пролетало незаметно, мы могли путешествовать по Франции, чем, собственно и занимались во время многочисленных майских праздников. Мы были в Дижоне, Лионе, Бельфоре, и о каждом из этих городов можно написать тома по три восторженных впечатлений.
Древний Дижон с узкими средневековыми улочками, со стремящимися в небо шпилями готических соборов, с разноцветными крышами домов, которые помнят еще рыцарей и Бургундское герцогство, собор Notre-Dame de Bourgogne, в котором находится статуя Девы Марии, созданная в XI в., Башня Филиппа Доброго, с которой виден, словно на ладони, весь город… О, о Дижоне можно говорить бесконечно.

Лион, город контрастов, стоящий на двух реках.

Бельфор, где проходит ежегодный музыкальный фестиваль, который объединяет всех, независимо от возраста и родного языка.

Средневековый замой Joux, где в дружбе с хозяином замка и в любви с его женой вольготно жил Мирабо, где погиб Туссен Лувертюр, где каждый камень имеет свою историю, свои легенды.

Обо всем не расскажешь, всего не перечислишь. Но бесконечно прекрасная Франция, удивительные преподаватели, на уроках которых час пролетает, как минута, выразительная лекция алжирского писателя А. Джемая о творчестве Камю - мы не забудем никогда о двух неделях, проведенных здесь.

Пойду собирать чемоданы и мечтать о том, чтобы не раз еще вернуться в Безансон.
Шпиленок Евгения

Безансон - это небольшой гостеприимный город на востоке Франции. Это не было моей первой поездкой в Безансон, но, тем не менее, этот город открылся для меня с новой стороны.

В Безансоне на удивление гармонично сочетаются нетронутая природа и городской пейзаж: жители города в выходные гуляют по набережной реки Ду, а в будни ведут урбанистический образ жизни.

Власти Безансона и его жители очень ответственно подходят к делу защиты окружающей среды. Так, что касается общественного транспорта, большинство автобусов ездят на природном газе (Pour le bien-être de tous, cet autobus roule en gaz naturel).

За время пребывания во Франции мы посетили не только Безансон, но и Дижон, который находится в часе езды от него. Мы также провели чудесный день в замке Château de Joux. После экскурсии по замку мы полакомились фондю, а потом на прогулочном катере отправились на водопад Le Saut du Doubs, который находится на границе со Швейцарией. Так что, можно сказать, что, не прилагая особых усилий, мы побывали и в Швейцарии.

Наконец, мы посетили студенческий музыкальный фестиваль в маленьком городке Бельфор. Там было представлено множество талантливых групп разных музыкальных стилей и направлений.

Что касается занятий в Центре прикладной лингвистики (CLA), то следует отметить профессионализм преподавателей, их готовность объяснить непонятные вещи и дать новые знания. Мы анализировали стихотворения, смотрели и разбирали фильм, занимались аудированием и устраивали дебаты.

В этой поездке мы лучше узнали друг друга, а также познакомились с новыми интересными людьми, с которыми нам наверняка захочется общаться и дальше.

Франция встретила нас великолепной погодой. Мы наслаждались теплом и солнцем, загорали, гуляли и дышали чистым воздухом Безансона.

Единственное, что меня смущает во Франции - это полный отказ магазинов и других заведений, предоставляющих услуги, работать по воскресеньям и праздничным дням. Для нас это было особенно ощутимо потому, что на наше пребывание их выпало очень много.

В целом я считаю, что наша поездка удалась, тем более что она, скорее всего, была последней в моей студенческой жизни.
Кашицын Игорь

Вот уже собраны чемоданы, не забыты документы, и чудо французской техники - TGV с огромной скоростью мчит нас из гостеприимного и уже почти своего Безансона в громадный Париж. Две недели во Франции пролетели с такой же молниеносностью, что и тот самый скоростной поезд - Train à grande vitesse. Сложно систематизировать все впечатления, но среди них остались самые яркие.

Первое, что бросается в глаза - в крылатой фразе “в Греции все есть” в XXI веке можно смело поменять название страны на Францию. Везде чувствуется, что Франция при всем своем космополитизме свято чтит собственные традиции и обособленность. Местные жители ездят на удобных французских автомобилях, заслуженно гордятся французской едой, которая действительно высочайшего качества, готовы целыми днями восхищаться своим языком и своей природой.

Сам Безансон оказался почти таким, как я его и представлял, но это отнюдь не значит, что он мне не понравился.

Наоборот, в городе сохранился дух Средневековой Франции - с ее церквями, мощеными улицами, маленькими двориками, в которых французы проводят вечера за бокалом вина.

Безансон для меня - это имена и названия: братья Люмьер, Гюго, «Красное и Черное» (написанный Стендалем, а не Гюго, как я считал когда-то). Красное - это величественная цитадель Вобана, с которой открывается необыкновенный вид на долину реки Ду, многочисленные бастионы, мосты, которые в случае войны поднимались и делали город практически неприступным. Даже название одного из кварталов города - Battant косвенно говорит о великом прошлом города. Черное - это сутана католического священника. Если помните, Жюльен Сорель собирался поступать в семинарию именно в Безансоне. Это поражающий воображение кафедральный собор, церковь Св. Мадлен, подножье которой превратилось в место встречи и обеда безансонских студентов.

Безансон необычайно удобно расположен, а развитые пути сообщения позволили мне за довольно короткий срок посмотреть не только сам город с его окрестностями, но и посетить Бургундию и ее очень красивую столицу Дижон, город-мечту Лион, весь центр которого является частью всемирного наследия, и даже на 5 минут зайти в Швейцарию после экскурсии в горы Юра.

Жители востока Франции оказались для меня неожиданно открытыми и гостеприимными, что замечательно сочеталось с их врожденным интеллектом и безупречным знанием этикета. Хочется от всей души поблагодарить принимавшую сторону, весь Центр прикладной лингвистики (CLA) и особенно наших преподавателей. Всем большое спасибо!

P.S. Отдельное спасибо кафедре и факультету и небольшое пожелание: а можно нас теперь на запад?! =) В Бордо, Нант или Тулузу =)
Будульчиева Наталья

Безансон стал для меня таким городом, в котором забываешь о существовании Москвы и Парижа - мегаполисов, подавляющих человека гигантскими размерами и небом, далеким и нереальным. Кто-то скажет, что все, что было с нами в Безансоне - сон или сказка, но мне этот город показался намного более реальным, чем какой-либо другой, потому что вода в нем - действительно вода, а звезды близкие и яркие.

Почти половина дней, проведенных во Франции, оказались праздничными. Благодаря этому обстоятельству, у нас было больше времени, чтобы самим побродить по Безансону, съездить в соседние города. Последнее восхитило меня больше всего: всего один-два часа езды на скоростном поезде, и ты в Дижоне, или в Лионе, или в Бельфоре. Да где угодно! Франция действительно маленькая страна, но всегда изумительно разная. Забавно было съездить в один день в Шато де Жу, настоящий средневековый замок-крепость, а на другой день оказаться в Бельфоре на фестивале университетской музыки.

Открытием для меня стали занятия в центре прикладной лингвистики. Это было на самом деле увлекательно: изучение текстов современных песен, фильмов, чтение популярных во Франции поэтов. Было интересно, наконец, просто пообщаться с преподавателями, узнать, где в Безансоне находятся лучшие кондитерские, или, например, где и как любит отдыхать местная молодежь.
Яна Щербина
Для меня это первое знакомство с Безансоном и с Францией. Знакомство очень долгожданное и приятное. Первое, что замечаешь в Безансоне - это отсутствие пробок на дорогах, так свойственных Москве. Да и машин в Безансоне мало - местные жители предпочитают велосипеды - польза и для здоровья, и для экологии. Нет машин - нет и шума, и воздух заметно чище. В городе много деревьев и цветов, большое количество фонтанов.

Французы умеют хранить свою историю, поэтому дома XVIII, XIX веков в прекрасном состоянии и пригодны для жилья, а вот современные постройки в этом городе - редкость.

Нельзя не сказать и о жителях города. На мой взгляд, это самые вежливые, самые добрые люди. За все время, проведенное мной в Безансоне, я не заметила, чтобы кто-нибудь устроил скандал или просто повысил голос. Удивляет милая привычка французов здороваться со всеми: и знакомыми, и незнакомцами.

В общем, Безансон стоит увидеть своими глазами, и я надеюсь, что я туда вернусь еще не раз.
Кирдяшев Иван

Нет ощущения, что мы в другой стране. Просто люди говорят на другом, ставшем уже почти родным, языке. Пока еще непонятен смысл происходящего, но кажется, мы уже во Франции.

… Несколькими часами позднее. Район Gare de Lyon. Площадь Бастилии.

Ночной Париж оказался грязным, немного маргинальным, опасным, но в то же время приветливым и зеленым городом. Будучи выгнанными с вокзала вместе с чемоданами, в холодной ночи мы пытались найти теплый очаг и удобный стул. В итоге, мы устроились на веранде кафе с вполне грозным названием «Bastilia». Бедный официант, который нас обслуживал, просто не знал что делать в полчетвертого утра с двенадцатью замерзшими и голодными русскими. В эту ночь мы почувствовали себя настоящими путешественниками…

5 часами позднее мы устроились в довольно удобном кресле (а главное теплом!) в TGV и отправились к нашему пункту назначения.

Благоухающая французская провинция. Немного «à côté », как выражаются местные, однако ничуть не теряющая своих достоинств, а именно:

  1. В городе чисто и зелено. «Besançon est une ville propre» - декларируют местные урны.
  2. Удивительна вежливость французов! Я сражен!
  3. 6 часов языка в день. Можно свихнуться! От счастья. Переживаю катарсис каждый вечер.
9 мая, Пятница. 5 дней до отъезда.

Лещенко, русский гимн и компания из 10 человек в тесном номере. Семнадцатикратное «ура!» и уже на следующее утро о нас знает все общежитие. Словом, это особая история о межкультурном общении.

В городке Belfort на севере региона проходил фестиваль музыки, на который мы и отправились. По пути нам встретились заводы Peugeot в Montbeillard. Незабываемое зрелище мощи французской промышленности. Belfort, к несчастью, оказался не «бель», а «саль». Видимо, несколько дней фестиваля и присутствие значительного количества людей (а уж тем более молодежи!) может испоганить любое место.

Однако выступления групп разных стран, музыкантов разной квалификации - от студентов пражской консерватории до бродячего студенческого оркестра из Португалии создало особый, едва ли забываемый колорит действа.

Воистину именно здесь больше всего обнажаются центробежные силы матушки-Европы. Она такая разная, но все-таки единая!

Последний урок с любимым преподавателем. Символический обмен подарками и чтение стихотворения, ставящее финальный, немного грустный аккорд нашей учебы. Лирично. Грустно. Прощай, Besançon.

Sans doute je reviens. J’espère donc je suis.

Ранний поезд и день в Париже. Чудом удалось попасть в Notre Dame de Paris. Там - толпы полуодетых туристов с отсутствующим видом освещают витражи вспышками своих «мыльниц». Сие место наводит и неприязнь, и благоговейное обожание одновременно.

Знакомство с парижским метро прошло неудачно - пришлось хитростью преодолеть турникет. Так-то, Russo Turisto! Затем мы отправились во все тот же аэропорт де Голля, который я считаю теперь лучшим из когда-либо виденных.

Merci à toi, chère République Française.

FIN
Пыльцина Мария

Безансон с первого взгляда поражает своими высокими крышами и узкими мощеными улочками. Пленяет своим уютом и безмятежностью. Первый раз я побывала в Безансоне два года назад, и уже тогда город запал мне в душу. Вроде, ничего особенного, но есть что-то такое, что заставило меня снова вернуться в столицу Франш-Конте. После первой поездки я прочитала книгу Стендаля «Красное и Черное», в которой часть действий разворачивается именно в Безансоне. И поэтому во время второго визита меня очень интересовал Безансон Жульена Сореля. Во время экскурсии по городу с месье Уабьяном мы посетили семинарию, в которую собирался поступать Жульен.

Очень приятно порадовала погода. Приятно вспоминать многочисленные пикники на траве в тени платанов и крепостной стены прямо у самой воды спокойной Ду.
Занятия в центре прикладной лингвистики CLA каждый раз поражали разнообразием. Мы успели ознакомиться и проанализировать несколько стихотворений французский авторов, посмотреть фильм «Амели», и даже овладеть жаргонным языком современной французской молодежи.

В конце поездки ужасно не хотелось уезжать. Но будем надеяться, что это наш не последний раз в Безансоне, и мы обязательно снова навестим этот спокойный, уютный и пленительный город и его добрых, открытых и радушных жителей.

Заведующий УНЦ


Общая информация

УНЦ компьютерной лингвистики была открыта в Институте лингвистики РГГУ в 2011 году при участии компании ABBYY и поддержке российского отделения IBM. УНЦ готовит профессиональных лингвистов, способных эффективно работать в области разработки инновационных языковых компьютерных технологий. С 2012 года УНЦ будет осуществлять подготовку магистрантов по программе «Компьютерная лингвистика» направления «Фундаментальная и прикладная лингвистика».

Компьютерная лингвистика является относительно новой областью научной и инженерной деятельности. Актуальность создания данной магистерской программы определяется тем, что в последние 10-15 лет наблюдается бурное развитие этой области, связанное со всё растущим влиянием Интернета и появлением огромного количества новых технических устройств, важнейшей частью которых являются естественно-языковые интерфейсы. Кроме того, в современной лингвистике происходит стремительный переход от традиционных методов получения языковых данных к корпусным методам, требующим серьёзного развития компьютерных технологий.

Очевидная, возрастающая год от года потребность в специалистах, способных участвовать в разработке соответствующих технологий, не подкреплена ещё, к сожалению, наличием адекватного образовательного стандарта в системе российского образования. Предлагаемая программа является одной из первых попыток определения того, какие именно специалисты требуются отрасли.

Область деятельности, связанная с решением задач автоматической обработки Естественного Языка (ЕЯ) и именуемая «Компьютерная лингвистика», требует подготовки специалистов двух принципиально отличающихся направлений: лингвистов и инженеров. Эти направления базируются на двух совершенно разных системах образования:

  • «Компьютерная лингвистика для инженеров» является частью т.н. Computer Science. В рамках этого направления готовятся инженеры, способные эффективно решать задачи автоматической обработки ЕЯ, опираясь на необходимые для конкретной задачи существующие лингвистические ресурсы и модели. УНЦ способствует появлению таких специалистов, взаимодействия с техническими вузами. В частности, с участием УНЦ компьютерной лингвистики РГГУ создаётся «параллельная» магистерская программа по компьютерной лингвистике для инженеров в МФТИ.
  • «Компьютерная лингвистика для лингвистов» является разделом теоретической и прикладной лингвистики. В рамках этого направления готовятся лингвисты, способные решать задачи создания формальных языковых моделей и выполненных на их основе лингвистических ресурсов, обладающих необходимыми свойствами для их применения в задачах автоматической обработки ЕЯ. Именно это направление реализуется магистерской программой «Фундаментальная и компьютерная лингвистика», созданной силами УНЦ.

Важнейшим обстоятельством является то, что специалисты, подготовленные в рамках этих двух направлений, являются необходимыми участниками любых серьезных проектов в области автоматической обработки ЕЯ. И хотя они выполняют существенно различающиеся функции, умение эффективно взаимодействовать между собой является ключевым фактором в успехе таких проектов. Основы такого взаимодействия закладываются в программах за счет серьёзной инженерной и математической подготовки лингвистов (и соответствующей лингвистической подготовки инженеров).

Таким образом, подготовка магистров по компьютерной лингвистике в данной программе основывается на глубоком изучении фундаментальных основ лингвистики с акцентом на методы создания операциональных формальных моделей языковой системы, адекватных сложности таких задач обработки естественного языка, как распознавание и синтез речи, машинный перевод, семантический анализ и понимание текста, интеллектуальный поиск.

Специфика УНЦ отражена в следующих разделах:

1. Формальные модели языка (с акцентом на перспективах прикладного использования);

2. Инструментальное направление: специализированные языки и пакеты для лингвистов (типа NLTK, R И т.п.), имеющиеся ресурсы (от грамматик и парсеров до онтологий);

3. Прикладное направление (отдельные важные задачи NLP, как они решаются, как используется лингвистика);

4. Математическая и инженерная подготовка. Статистика, формальные грамматики, представление о методах машинного обучения.

Магистрантам направления «Компьютерная лингвистика» УНЦ читает следующие курсы:

  • Математические основы компьютерной лингвистики. Обзорный курс основных математических методов, применяемых в компьютерной лингвистике: математическая логика; теория вероятностей и статистика; формальные грамматики; теория алгоритмов, в частности - понятие сложности алгоритма; машинное обучение;
  • Программирование лингвистических задач (NLTK и R). Задача курса – обучение студентов работе с доступными интерпретаторами на основе языка Python. Краткое введение в методы программирования в целом;
  • Общая и компьютерная лексикография (по программе Lexicom). Курс знакомит студентов с принципами современной системной лексикографии; с новыми методиками лексикографической работы, включая корпусные методы. Рассматриваются современные компьютерные системы создания словарей, анализируются новые тенденции в лексикографии (вики-проекты, экспертные методы оценки филиации и т.п.);
  • Модели и методы автоматической обработки текста (NLP/АОТ). Обзорный курс, состоящий из двух частей (матричный, с разными лекторами): основные лингвистические модели + основные решаемые задачи. Курс методически связан с курсом «Математические основы лингвистических исследований». Первая часть курса носит резюмирующий характер и опирается на системные знания о языке, полученные магистрами в ходе обучения в бакалавриате по лингвистическим специальностям (эти знания являются необходимыми для сдачи вступительного экзамена);
  • Лингвистические и онтологические модели. Идеологически очень важный курс, перебрасывающий мостик между лингвистическими и экстралингвистическими моделями. В курсе рассматривается интерфейс между лексико-семантическими и онтологическими описаниями (в частности, проект Игоря Богуславского). Анализируются современные лингво-онтологические ресурсы (*net), современные проекты «мэппинга» между ними (Марта Палмер и К);
  • Корпусная лингвистика. Рассматриваются проблемы создания и оценки корпусов. Интернет как корпус. Методы автоматического создания корпусов. Анализ методов использования корпусов в лингвистических исследованиях (оценка значимости полученных статистических результатов).
  • Лингвистическое аннотирование и разметка. Языки и методы разметки, начиная с XML. Идеологически близко курсу Хови;
  • Машинный перевод;
  • Методы оценки NLP-приложений;
  • Формальные модели и ресурсы основных мировых языков (неиндоевропейских);
  • Информационный поиск;
  • Вопросно-ответные системы (спецкурс IBM);
  • Специализированные лингвистические базы данных.

Студентам Института Лингвистики (специалитет, бакалавриат, магистратура) УНЦ читает следующие курсы:

  • Введение в компьютерную лингвистику;
  • Компьютерная лингвистика. Основные задачи и технологии;
  • Современные методы социолингвистики;
  • Автоматический перевод
  • Лингвистические основы машинного перевода;
  • Основы информатики;
  • Основные направления лингвистического обеспечения новых информационных технологий (компьютерный анализ текстов);
  • Информатика и информационные технологии в лингвистике;
  • Автоматическая обработка естественного языка;
  • Автоматическая обработка текста, Автоматическая генерация текстов-описаний изображений;
  • Компьютерное обеспечение переводческой деятельности;
  • Корпусная лингвистика.

Студенты проходят практику в компании ABBYY.

См. также страницу УНЦ компьютерной лингвистики на сайте компании ABBYY.

Список сотрудников УНЦ компьютерной лингвистики

Владимир Павлович Селегей – директор по лингвистическим исследованиям компании ABBYY, заведующий УНЦ компьютерной лингвистики
«Введение в компьютерную лингвистику»