В рамках большого материала об Анне Ахматовой мы проанализировали тексты ее произведений, и визуализированли результаты. По-видимому, студия инфографики ТАСС сделала такое впервые (как минимум, впервые на русском языке).
Первый график — сентимент-анализ
Сентимент-анализ текста позволяет выявлять эмоциональную окраску текста, и мспользуется, например, при автоматическом анализе отзывов клиентов.
Возможно, это покажется кощунством, но сентимент-анализ неплохо сработал и на художественных текстах.
Первый график показывает настроение произведений по годам, можно выбрать суммарный показатель или увидеть данные по отдельным произведениям.
Второй график – особенности словарного запаса
Этот график показывает отличия частотного состава языка Анны Ахматовой от частотного состава корпуса русского языка. То есть, какие слова Ахматова использует чаще (или реже) среднего, и насколько.
Третий график – две поэмы
Взяты два основных произведения Анны Ахматовой, которые она писала на протяжении нескольких лет. На диаграмме выделены слова, уникальные для каждого из произведений, и слова, встречающиеся в обоих. Спойлер: «Я», как всегда, главное слово в лирике поэтессы.
Посмотреть проект целиком можно (и оно того стоит) по адресу https://tass.ru/spec/ahmatova.