Чем больше по объему текст, тем объективнее результаты исследования.

Количественное исследование текстов (и, а именно, идиостиля создателя) становится по-настоящему беспристрастным, если оно имеет сравнительный нрав (подразумевает сравнение с текстами других создателей).

Корректным является сравнение текстов, написанных примерно в одно время.

Лингвистика текста: «корпусная философия»

АОТ: различные уровни внедрения.

Существущие корпуса. «Литературоцентричность» НКРЯ.

Идиостилевые словари (в том числе частотные Чем больше по объему текст, тем объективнее результаты исследования.).

Словари языка писателя

Стилевые и частотные словари А. С. Пушкина, Л. Андреева, А. Блока, И. Гончарова, А. Грибоедова, А. Дельвига, Ф. Достоевского, А. Чехова, В. Шукшина, поэзии 1-й пол. ХХ в. …

! Неувязка отражения специфичности идиостиля.

Новый частотный словарь российской лексики

Под ред. С. А. Шарова и О. Н. Ляшевской

http://dict Чем больше по объему текст, тем объективнее результаты исследования..ruslang.ru/freq.php

Основан на данных Государственного корпуса российского языка

Содержит информацию о встречаемости слов в текстах различных функц. стилей (в том числе и в художественных текстах)

Способности АОТ и корпусов

Как отразить в исследовании языка писателя конкретно то личное, что охарактеризовывает язык его произведений?

Вопрос о лексико-статистической методике.

?

В Чем больше по объему текст, тем объективнее результаты исследования. какой степени набор самых частотных слов неанонимного текста может охарактеризовывать стиль создателя и отражать его персональную картину мира?

! Неувязка определения авторства анонимного текста не рассматривается.

Лексическая статистика и идиостиль создателя

Абсолютная частотность слова в тексте сама по для себя не может являться показательной для анализа концептуальной системы создателя. Есть слова типа быть Чем больше по объему текст, тем объективнее результаты исследования., человек, глаз, город, гласить, созидать, желать и т.д., распространенные фактически в любом художественном тексте.

«Топ» лексической частотности по А. О. Гребенникову

А. П. Чехов: гласить, сказать, один, мочь, знать, глаз, человек, рука, лицо, два, стать, глядеть, мыслить, большой, жизнь, идти, денек, голова, посиживать, созидать, другой, жить, дом, казаться, раз, спать Чем больше по объему текст, тем объективнее результаты исследования., дело, время, супруга, люди, бог, взять…

Л. Н. Андреев (рука, глаз, сказать, гласить, мочь, лицо, другой, знать, голова, отец, люди, человек, стать, жизнь, глядеть, созидать, слово, мыслить, нога, желать , глас, идти, денек, казаться, раз, земля, дама, дом, темный, два, ночь, стоять…

Догадка

Сверхчастотные слова, являющиеся универсальными для текстов Чем больше по объему текст, тем объективнее результаты исследования. различных создателей можно отсечь и разглядеть индивидуально-авторский «слой».

Сопоставительный принцип анализа

точную и полную подборку слов, отражающих стиль создателя, может обеспечить только сравнительный количественный анализ.

Снова, так как принципиально:

Материалом должны стать по последней мере три создателя и более 3-х произведений каждого из их.

Чем больше по объему текст Чем больше по объему текст, тем объективнее результаты исследования., тем объективнее результаты.

Сопоставлять нужно тексты, написанные примерно в одно время.

Произведений

4 известнейших

Российских романистов ХХ в.

(около 1,5 млн словоупотреблений):

М. Булгаков, В. Набоков, А. Платонов, М. Шолохов:

Почему конкретно они?

самые «крупные» (в смысле формы и количества текстов)

Самые наилучшие (? – вкусовой аспект)

Самые известные, признаны классиками

Все писали по-русски

Владеют броской индивидуальностью

Работали Чем больше по объему текст, тем объективнее результаты исследования. приблизительно в одно время

Возможно, личные стилевые особенности должны отражать

Слова, попадающие в «пик частотности» 2-ух и поболее произведений 1-го создателя и менее чем в одно чужое произведение (самая показательная группа)

Объект рассмотрения – знаменательная лексика

Леммы, извлеченные из текстов, упорядочены по частоте

Выбрано по 1000 самых частотных в каждом тексте

Сформированы группы слов Чем больше по объему текст, тем объективнее результаты исследования., частотных для 1-го писателя и нечастотных для других.

М. Булгаков: пьеса, кот, повелитель, сцена, актер, роман, глава, публика, воскликнуть, передняя, переулок, создатель, директор… 148 слов, 5949 контекстов

В. Набоков: игра, платьице, удивительно, сначала, гостиница, журнальчик, сияние, столовая, приниматься, панель, стеклянный… 196 слов, 5322 контекста

А. Платонов: коммунизм, паровоз, природа, пролетариат, социализм, еда, масса, скучновато, место, тосковать… 292 слова Чем больше по объему текст, тем объективнее результаты исследования., 7653 контекста

М. Шолохов: казак, хутор, полк, дед, сразу, станица, бык, фронт, казачий, крыльцо, юноша, седло, рубашка… 192 слова, 20929 контекстов

Для сопоставления («абсолютный» перечень самых частотных) :

быть, сказать, еще, уже, один, мочь, знать, рука, гласить, человек, очень, стать, вдруг, глаз, сейчас, год, денек, снова, лицо, позже, дверь, комната, два, нет, время Чем больше по объему текст, тем объективнее результаты исследования., выходить, жизнь, посиживать, 1-ый, отец, здесь, голова, осознавать, раз, мыслить, идти, казаться, дом, супруга, созидать, пойти, темный, глас, спрашивать, слово, стоять, ничего, идея, дело, нога, отыскивать, стол, сходу, окно, желать, на данный момент, глядеть, белоснежный, глядеть, поразмыслить…

(К авторской лексикографии)


chelovek-s-zolotimi-bronzovkami-15-glava.html
chelovek-s-zolotimi-bronzovkami-5-glava.html
chelovek-s-zolotimi-bronzovkami.html