Анализ сообщений ВК (частота слов)

В одном городе, одним вечером, один человек захотел поковырять API Вконтакте...

Анализ сообщений ВК (частота слов)

На данный момент здесь представлен довольно топорный анализ (можно ли это считать анализом? :D) диалогов в ВК.

Здесь нет "умных" алгоритмов отбора слов. Только Python-обертка над API Вконтакте, регулярки и базовые возможности пакета Pandas.

При помощи API, получаем всю историю диалогов с определенным пользователем. После этого парсим полученную груду текста, разбираем на отдельные слова, и анализируем, какие же слова у нас оказались самыми часто употребляемыми.

Как использовать?

Переходим на сайт https://vk.com/dev/ и создаем standalone app.
Читаем, как можно получить токен для приложения (нужные разрешения для этого приложения - messages) - https://vk.com/dev/auth_mobile
cp config.example config.py
В файле config.py определяем переменные APP_ID, TOKEN, MY_ID, FRIEND_ID, WORDS_COUNT (по дефолту == 20; кол-во слов, которые отобразятся в консоли после анализа)
Запускаем файл get_messages_app.py и уходим пить чай 🍵, пока стягивается история сообщений, учитывая ограничение на 1 запрос в 3 секунды (время распития чая зависит от того, сколько времени вы провели в диалогах вк, вместо того, чтобы работать 😁)
В корне проекта появится файл вида messages_*FRIEND_ID*.txt, содержащий всю историю переписки
После завершения работы, запускаем get_statistics.py, файл, который занимается непосредственно "анализом".
Скрипт отобразит в консоли 20 самых часто употребляемых слов (или то количество, которое определили в конфиге). 📝 Можно добавить в код запись этих слов в файл :)

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
config.example		config.example
get_messages_app.py		get_messages_app.py
get_statistics.py		get_statistics.py
stopwords.txt		stopwords.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Анализ сообщений ВК (частота слов)

Как использовать?

About

Releases

Packages

Languages

Letoile/vk_messages_analysis

Folders and files

Latest commit

History

Repository files navigation

Анализ сообщений ВК (частота слов)

Как использовать?

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages