http://www.speech.nw.ru/,
http://www.imli.ru/zagovor/,
www.lingsoft.fi/doc/rustwol.txt.
Подготовьте презентацию о ней.
(Индивидуально) Выбрать одну из доступных в Интернете лингвистическую базу данных: http://www.speech.nw.ru/, www.imli.ru/zagovor/, www.lingsoft.fi/doc/rustwol.txt. Подготовьте презентацию о ней.
Составить таблицу формообразования (по выбору) в Excel.
Четвертый урок
Тема: Основные ИКТ прикладной русистики: корпус данных и корпус текстов
Цель в предметной области: знакомство с Национальным корпусом русского языка и другими корпусами, систематизация знаний о лексическом значении слова.
Цель в формировании информационно-коммуникационной компетентности: знакомство с технологией национальных корпусов.
Задачи:
1. Установить основные отличия корпуса данных от базы данных.
2. Определить цели создания национальных корпусов.
3. Определить достоинства представления национального языка в виде корпуса.
4. Определить спектр задач, решаемых на материале Национального корпуса русского языка.
Формы: лекция с обсуждением. приемы реализации задач:
1. Характеристика корпуса текстов с показом мультимедийной презентации.
2. Показать достоинства работы с корпусом текстов в презентации.
3. Продемонстрировать возможности поиска информации в корпусе на компьютере.
4. Индивидуальная работа над материалами из Национального корпуса русского языка.
Материалы для урока
Корпус данных – особый вид базы данных. В отличие от базы данных, корпус данных претендует на отражение реальной картины, существующей в предметной области. Обычно корпус данных формируется из текстов. По запросу пользователя из корпуса извлекаются материалы. Единица извлечения материала определяется единицей хранения. Если единицей хранения является слово, то на запрос пользователя из корпуса будет извлекаться отдельное слово (как в орфографических словарях); если же единица хранения – словосочетание, то пользователь на запрос о слове получит ближайшие контексты интересующего его слова; при единице хранения предложении «ответом» пользователю будет целое предложение и т. п.
В качестве материалов предлагаем главу о корпусной лингвистике из учебного пособия И. Г. Овчинниковой и И. А. Углановой «Компьютерное моделирование речевой коммуникации» (Пермь 2006). Приведем некоторые выдержки из данного пособия.
Корпусная лингвистика – одна из наиболее востребованных отраслей прикладного языкознания. Бурное развитие корпусной лингвистики обусловлено необходимостью создания ресурсов, обеспечивающих доступ к языковому материалу, качественно обработанному и репрезентативному. Одна из основных прикладных задач, стимулирующих бурное развитие корпусной лингвистики, – обеспечение систем машинного перевода, новое поколение которых использует корпусы текстов