Skip to content

Latest commit

 

History

History
18 lines (9 loc) · 2.29 KB

README.md

File metadata and controls

18 lines (9 loc) · 2.29 KB

Telegram-spam-ham

Описание проектов

Проект 1: Классификация текста с использованием наивного байесовского классификатора

Этот проект направлен на решение задачи классификации текста с помощью наивного байесовского классификатора. Мы загружаем данные из CSV файла, содержащего текстовые сообщения и их метки класса, разделяем данные на обучающую и тестовую выборки, векторизуем тексты с помощью метода мешка слов, и обучаем наивный байесовский классификатор для предсказания меток классов.

Мы оцениваем производительность модели с помощью нескольких метрик, таких как точность (accuracy), точность (precision), полнота (recall) и F1-мера (F1-score), и выводим полученные результаты.

Проект 2: Генерация текста с использованием LSTM модели

Этот проект посвящен генерации текста с использованием модели LSTM (Long Short-Term Memory). Мы загружаем текстовые данные из CSV файла, предварительно очищаем текст от знаков препинания и приводим к нижнему регистру. Затем мы токенизируем текст и обучаем LSTM модель для генерации нового текста.

Мы разделяем данные на обучающую и тестовую выборки, преобразуем текст в последовательности токенов, создаем и обучаем модель LSTM, а затем генерируем новый текст, используя обученную модель.

Модель оценивается по проценту совпадения сгенерированного текста с исходными данными.