Словенский национальный корпус - Slovenian National Corpus - Wikipedia

Словенский национальный корпус FidaPLUS - это 621 миллион слов (токенов) корпус из Словенский язык, собранных из избранных текстов, написанных на словенском языке разных жанров и стилей, в основном из книг и газет.[1]

База данных FidaPLUS является обновлением старого корпуса (FIDA), который был разработан в период с 1997 по 2000 год, с добавленными текстами, которые были опубликованы до 2006 года и являлись результатом прикладного исследовательского проекта факультета гуманитарных наук факультета социальных наук. , обе Университет Любляны, и Институт Йожефа Стефана Департамент технологий знаний.[2]

Корпус доступен через менеджер корпуса Sketch Engine.[3] Эта версия корпуса FidaPLUS содержит Наброски слов, автоматический обзор грамматического и коллокационного поведения слова на основе корпуса.

Год публикацииЧисло словПроцентов
1979 - 1990262.7080.04%
19911.487.8950.24%
19922.256.6920.36%
19933.208.6870.52%
19947.534.6891.21%
19957.433.8971.2%
199616.913.9162.27%
199731.589.2505.09%
199843.512.0417.01%
199954.711.6308.81%
200057.677.5349.29%
200174.720.53212.03%
200272.802.48411.72%
200382.897.09713.35%
200467.041.16710.79%
200539.086.6956.29%
200644.526.8257.17%
Нет данных13.486.2612,17%

Рекомендации

  1. ^ «Архивная копия». Архивировано из оригинал на 2010-11-14. Получено 2012-03-15.CS1 maint: заархивированная копия как заголовок (связь) Количество слов FidaPLUS на дату публикации
  2. ^ «Архивная копия». Архивировано из оригинал на 2012-03-21. Получено 2011-03-22.CS1 maint: заархивированная копия как заголовок (связь) Список команды FidaPLUS и институциональная принадлежность
  3. ^ Корпус FidaPLUS в Sketch Engine

внешняя ссылка