Прикладной (компьютерный) лингвист — это инженер на стыке гуманитарной лингвистики и машинного обучения. Он отвечает за то, чтобы голосовой ассистент понял команду, чат-бот ответил по делу, а большая языковая модель не галлюцинировала на доменных вопросах. В отличие от теоретика, он не публикует статьи в Q1-журналах, а сдаёт релизы и тащит метрики. Зарплатная вилка в РФ в 2026 году — 120–180 тыс ₽ у junior, 250–500 тыс ₽ у senior NLP-инженера в крупных технологических компаниях. Чем занимается прикладной лингвист Список задач широкий. На одном полюсе — лингвистическая разметка данных: создание правил, гайдлайнов для аннотаторов, контроль качества разметки, валидация датасетов для обучения моделей. Это критически важный этап, без которого никакая нейросеть не научится отличать упоминание города от упоминания компании с тем же именем. На другом полюсе — инженерия: написание пайплайнов препроцессинга текста, обучение и дообучение моделей, оценка их качества, выкатка в продакшен. Внутри NLP есть несколько крупных направлений, каждое со своим стеком. Машинный перевод (Яндекс.Переводчик, Tilde, переводческие плагины) требует знания морфологии исходного и целевого языков, выравнивания корпусов, постредактирования. Голосовые ассистенты (Алиса, Маруся, Салют, Сбер) — это связка ASR (распознавание речи), NLU (понимание намерения), генерация ответа и TTS (синтез речи); лингвист участвует в каждом блоке. Чат-боты для бизнеса — разметка intents и entities, обучение классификаторов, рерайт сценариев. Последние 4 года рынок захватили большие языковые модели. Прикладной лингвист в команде LLM занимается тюнингом моделей под доменные задачи (юридический помощник, медицинский ассистент, бот техподдержки), построением RAG-систем (retrieval-augmented generation: связка LLM с базой документов), оценкой галлюцинаций, проектированием prompt-шаблонов и evals, разметкой данных для RLHF и preference optimization. Hard skills и инструменты Базовый стек прикладного лингвиста — это смесь гуманитарной подготовки и инженерных навыков. Python и его ML-стек (numpy, pandas, scikit-learn) — рабочий язык; без него на рынок NLP в 2026 году не выйти. NLTK, spaCy, Stanza, Natasha, DeepPavlov — библиотеки классической обработки текста: токенизация, лемматизация, NER, синтаксический разбор. HuggingFace Transformers и datasets — основная экосистема для работы с языковыми моделями; знание моделей BERT, RoBERTa, T5, mBART, отечественных RuBERT, ruT5, GigaChat. PyTorch (реже TensorFlow) — фреймворк для обучения и файнтюнинга моделей. Системы разметки корпусов (Inception, Brat, Label Studio, Doccano) — администрирование проектов разметки, дизайн гайдлайнов, контроль качества аннотаторов. Векторные базы и поиск (FAISS, Qdrant, Weaviate, pgvector) — основа RAG-систем и семантического поиска. MLOps-стек (Docker, Git, MLflow, DVC, Airflow) — выкат моделей в прод, версионирование данных и экспериментов. SQL и анализ логов — почти любая продуктовая задача требует поднять данные из хранилища. Карьерный путь Старт — junior NLP-инженер или младший лингвист-аналитик. Это позиция для выпускника бакалавриата 45.03.03 «Фундаментальная и прикладная лингвистика», который умеет писать на Python, понимает базовый ML и провёл хотя бы один учебный проект (классификатор тональности, NER на собственном корпусе). Зарплата в Москве в 2026 году — 120–180 тыс ₽, в Петербурге 110–160 тыс ₽, на удалёнке из регионов 90–140 тыс ₽. Через 1,5–2 года вырастает до middle: ведёт свои фичи, обучает и дообучает модели, проектирует разметку, отвечает за метрики продукта. Вилка — 180–280 тыс ₽ в Москве. Через 4–6 лет — senior NLP-инженер или ведущий лингвист с зарплатой 280–400 тыс ₽. На уровне tech lead или принципала в крупных компаниях (Яндекс, Сбер, VK Tech, Тинькофф, MTS AI, Х5) — 400–600 тыс ₽ плюс премии и опционы. Параллельная ветка — research-роли в больших командах LLM. Здесь нужна более глубокая ML-подготовка: знание архитектур, статей с EMNLP/ACL/NeurIPS, опыт публикаций. Стартует с middle с зарплатой 250–350 тыс ₽, senior researcher с публикациями и опытом обучения моделей с нуля — 350–550 тыс ₽. Это меньшая ниша, но самая высокооплачиваемая в NLP в РФ. Третий трек — фриланс и консалтинг под бизнес-задачи. Лингвист-консультант с опытом ведёт по 2–4 проекта параллельно (банк, ритейл, медицина), берёт 4–10 тыс ₽ за час или 300–700 тыс ₽ за фикс-проект. Это нестабильный, но потенциально более высокий доход. Четвёртый трек — собственные продукты и стартапы (например, на базе LLM для отдельной вертикали), но это уже не зарплатная история. Сколько зарабатывает в 2026 году Зарплаты в прикладной лингвистике — одни из самых высоких среди гуманитарных профессий. Москва: junior — 120–180 тыс ₽, middle — 180–280 тыс ₽, senior — 280–400 тыс ₽, lead — 400–600 тыс ₽. Санкт-Петербург на 5–15% ниже. Удалённая работа в крупных тех-компаниях из регионов — обычно 80–95% от московской ставки. Сравнение секторов: технологические гиганты (Яндекс, Сбер, VK Tech) и крупные финтехи платят по верхней границе вилок. Промышленные компании, госструктуры, медиа — по нижней, часто на 20–30% ниже. Стартапы — широкий разброс: от низких ставок плюс опционов в early-stage до конкурентных зарплат и опционов в успешных series A–B проектах. Гибридные специалисты ценятся отдельно. Лингвист с глубокой подготовкой в формальной семантике и опытом разработки evals для LLM — редкий профиль с премией к зарплате 20–40%. То же с фонетистами в командах ASR/TTS, специалистами по морфологии редких языков для машинного перевода, психолингвистами в UX-исследованиях диалоговых интерфейсов. Где учиться Основное направление — 45.03.03 «Фундаментальная и прикладная лингвистика». Программа сочетает лингвистический бэкграунд, математическую логику, программирование на Python, базы данных, основы машинного обучения. Это лучшая отправная точка для NLP-карьеры. Альтернативы — 02.03.02 «Фундаментальная информатика и информационные технологии» с минором по лингвистике, 09.03.01 «Информатика и вычислительная техника» с самостоятельным освоением языкознания. Магистратура (45.04.03, профили «Компьютерная лингвистика», «Прикладная и компьютерная лингвистика», «Цифровые гуманитарные науки») даёт углубление в современный NLP и доступ к промышленным стажировкам. Альтернативный вход — техническая магистратура (01.04.02, 02.04.02, 09.04.01) с дипломом по NLP-теме. Без сертификатов и онлайн-курсов в NLP сейчас не выйти даже из самого сильного бакалавриата. Минимальный набор: Stanford CS224N (NLP with Deep Learning), курсы по машинному обучению от ШАД, Karpov.courses, MIPT, OpenDataScience. Регулярное чтение arXiv, статей с EMNLP/ACL и блогов команд LLM (HuggingFace, Stanford NLP, отечественные ai-форумы) — рабочая привычка. Pet-проекты и Kaggle-соревнования по NLP — то, что закрывает junior-позиции наряду с дипломом. Похожие специализации Близкие роли: ML-инженер общего профиля (более широкий стек, без обязательной лингвистической глубины); data scientist в продуктовой команде (часть задач NLP, часть — общая аналитика); ASR/TTS-инженер (узкая ниша обработки речи на стыке с цифровой обработкой сигналов); UX-исследователь голосовых интерфейсов (на стыке лингвистики и продуктового дизайна). Многие прикладные лингвисты с годами дрейфуют либо в чисто ML, либо в продукт-менеджмент в AI-командах.