Профессия компьютерный лингвист
Компьютерный лингвист разрабатывает алгоритмы распознавания звучащей и письменной речи, QA-систем, систем машинного перевода, создает инструменты для разработки чат-ботов, голосовых ассистентов и т. д. Профессия подходит тем, кому одновременно нравится изучать и языки – иностранные и русский, литературу, и математику с информатикой. Для входа в профессию нужно получить высшее образование. Кстати, недавно центр профориентации ПрофГид разработал точный тест на профориентацию, который сам расскажет, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте. Профессия подходит тем, кого интересует математика, иностранные языки и русский язык и литература (см. выбор профессии по интересу к школьным предметам).
- Краткое описание
- Особенности профессии
- Что делает компьютерный лингвист
- Плюсы и минусы профессии
- Важные личные качества
- Обучение на компьютерного лингвиста
- Лучшие вузы для компьютерных лингвистов
- Лучшие курсы
- ИТ-курсы
- Место работы
- Заработная плата
- Зарплата компьютерного лингвиста на декабрь 2024
- Профессиональные знания
- Примеры компаний с вакансиями компьютерного лингвиста
Краткое описание
Компьютерная лингвистика – это наука с множеством прикладных направлений. Самое крупное связано с обработкой больших данных – Big Data. В Интернете есть терабайты текстов в новостных лентах, соцсетях. Из них надо буквально выуживать определенную информацию, например, отслеживать тематические инфоповоды, чтобы предлагать в рекомендациях публикации, соответствующие вкусам пользователя.
Компьютерная лингвистика помогает решить огромное количество других, не менее важных задач. Компьютерные лингвисты принимают участие в создании алгоритмов и программ, которые используются:
- для извлечения разного рода данных (определенная лексика, формы слов и др.) из огромного массива текстовой информации;
- разработки онлайн-словарей, переводчиков;
- создания голосовых помощников;
- проектирования QA-систем;
- обеспечения безопасности в Интернете и т. д.
Например, алгоритмы распознавания естественно звучащей речи используются в системах умных домов, современных гаджетах. Такие технологии облегчают жизнь обычных пользователей и людей с ограниченными возможностями. К созданию всем известных онлайн-переводчиков и редакторов текста (Word) тоже приложили руку компьютерные лингвисты. В том, что реклама в Интернете выдает вам объявления, исходя из истории вашего поиска, тоже есть их «заслуга».
Особенности профессии
Компьютерный лингвист обрабатывает данные на языках алгоритмов машинного обучения – чаще всего это Python, R, Java, JavaScript, C++. Например, отмечает в больших массивах текстов верные и ошибочные варианты употребления слов, создает тезаурусы для поисковых систем и электронные словари. После этого за дело берутся датасайентисты и разработчики, чтобы машины научились распознавать человеческие языки и автоматически переводить с одного на другой, находить ошибки в текстах, преобразовывать устную речь в письменную, вести диалоги в чат-ботах, откликаться на голосовые команды.
Общее у компьютерных и естественных языков то, что это знаковые системы. Компьютерному лингвисту надо уметь одинаково хорошо работать сразу с двумя и видеть точки их пересечения.
Компьютерные лингвисты работают в связке с датасайентистами и девелоперами, которые пользуются данными, размеченными лингвистами. Поэтому им надо не просто обрабатывать текстовые данные – им нужно формировать методологию, разъяснять коллегам ее принципы. Для этого пригодятся навыки межпрофессиональной коммуникации.
Деятельность компьютерных лингвистов имеет важное социальное значение, ее результаты применяются в сфере Artificial Intelligence, машинного обучения, Big Data.
Что делает компьютерный лингвист
В зависимости от места работы компьютерный лингвист может:
- участвовать в создании QA-систем и алгоритмов развития искусственного интеллекта;
- разрабатывать программы, которые имитируют познавательную языковую деятельность человека: умение читать, воспринимать на слух, говорить, поддерживать диалог, переводить с разных языков;
- создавать алгоритмы систематизации текстов по разным признакам;
- разрабатывать программы для поиска в текстах определенной информации;
- программировать генераторы текстов;
- создавать электронные словари, библиотеки и другие базы хранения лексических и языковых единиц;
- разрабатывать алгоритмы оценки качества машинного перевода, проверки орфографии, сравнения текстов для поиска плагиата и т. д.
Компьютерные лингвисты могут быть аналитиками. Например, применяя алгоритмы обработки текста, они собирают информацию о разных объектах и на основании тональности реакций пользователей в отзывах, постах определяют, нравится новый фильм или нет, за кого на выборах проголосуют пользователи «Твиттера».
Плюсы и минусы профессии
Плюсы:
- Профессия новая, поэтому кадровый рынок пока испытывает дефицит компьютерных лингвистов.
- Интересная творческая работа.
- Специалисты, обладающие хорошей базой знаний, могут найти работу в крупнейших компаниях. В них заинтересованы Google, «Яндекс», VK (Mail.ru Group) и другие технологические холдинги.
- Компьютерные лингвисты разбираются в двух совершенно разных областях – ИТ и прикладном языкознании. При желании они могут сменить сферу деятельности: уйти в программирование или перевод, цифровую журналистику, маркетинг.
- Работа хорошо оплачивается.
- В ближайшие несколько десятков лет компьютерная лингвистика будет динамично развиваться.
- Работодатели оказывают компьютерным лингвистам содействие во всех вопросах, связанных с повышением квалификации, обучением.
Минусы:
- Компьютерная лингвистика – непростая прикладная наука, для работы нужна длительная подготовка.
- Немногие могут быть сразу и гуманитариями до мозга костей, и продвинутыми программистами. Работа компьютерного лингвиста предполагает именно такой трудно достижимый симбиоз.
- Деятельность связана с работой за компьютером, поэтому лингвисты подвержены риску ряда профессиональных заболеваний: проблемы со зрением, опорно-двигательным аппаратом.
Важные личные качества
Компьютерные лингвисты – это гуманитарии и технари в одном лице. Они педантичны, к работе относятся скрупулезно и с программистской системностью. Обладают логическим мышлением, умением концертировать внимание, усидчивостью, склонностью к активной командной работе. Еще надо уметь выживать в условиях вечной многозадачности.
Обучение на компьютерного лингвиста
Для входа в профессию надо пройти подготовку в вузе по направлению «Фундаментальная и прикладная лингвистика» (код: 45.03.03). Профильные ЕГЭ для этой специальности: русский и иностранный язык. Еще на выбор нужно сдавать экзамены по математике, литературе, обществознанию или информатике. Обучение можно продолжить, в магистратуре. Например, в НИУ «ВШЭ» открыта магистерская программа «Компьютерная лингвистика». «Чистые» лингвисты могут пройти дополнительную подготовку на курсах, связанных с AI, ML (машинное обучение, искусственный интеллект) и другими смежными ИТ-областями.
Лучшие вузы для компьютерных лингвистов
- НИУ ВШЭ.
- РГГУ.
- МГУ им. М. В. Ломоносова.
- ДВФУ.
- УрФУ.
- НГУ.
- ЮУрГУ (НИУ).
- СГУ им. Н. Г. Чернышевского.
- ВГУ.
- КубГУ.
Лучшие курсы
- Skillbox.
- GeekBrains.
ИТ-курсы
Место работы
В компьютерных лингвистах заинтересованы IT-агентства, а также крупные компании, деятельность которых связана с созданием инновационных продуктов и технологий, поисковыми системами, проведением лингвистической экспертизы, хранением и обработкой данных. Специалисты могут найти работу в НИИ, аналитических агентствах и т. д.
Заработная плата
Размер заработной платы зависит от опыта компьютерного лингвиста, его способностей, склонности к постоянному обучению и статуса компании, в которой он работает. Специалист обладает глубокими знаниями в разных областях, поэтому может увеличить свой доход, выполняя переводы, лингвистические экспертизы и другие задачи.
Профессиональные знания
- Лингвистика.
- SQL.
- Математические модели в лингвистике.
- Языки программирования (Python, Ruby и другие).
- Машинное обучение, искусственный интеллект и нейросети.
- Иностранные языки (желательно не только английский).