Машиночитаемый Викисловарь/Словарные пометы и толкования
Внешний вид
Построение файла с пометами и толкованиями
[править]Задача:
- извлечь из базы данных машиночитаемого Викисловаря словарную помету и толкование;
- записать их в файл таким образом, что на каждой строке файла идут
- слово (название словарной статьи),
- словарная помета (или несколько помет),
- текст толкования.
Пример файла:
подвизаться|книжн.|ирон.|осуществлять деятельность, работать, действовать в какой-нибудь области подвизаться|религ.|совершать подвиг в чём-либо, часто о ежедневном борении заткнуться|перен.|груб.|то же, что замолчать; перестать говорить, кричать, плакать; замолкнуть
GoEmotions и словарные пометы
[править]- seara/ru_go_emotions
- ru-goemotions (GitHub)
- ru-goemotions/ru-go-emotions-creation.ipynb (Jupyter Notebook)
Цель в два шага:
- для каждой строки нашего файла (слово, помета, текст) получить по тексту толкования оценки 28 эмоциональных тегов.
- суммировать, нормировать — получить усреднённые эмоциональные оценки для словарных помет (получить эмоциональный вектор для каждой из словарных помет).
Ссылки
[править]- goemotions // GitHub
Литература
[править]- Demszky, D., Movshovitz-Attias, D., Ko, J., Cowen, A., Nemade, G., & Ravi, S. GoEmotions: A dataset of fine-grained emotions. 2020. arXiv preprint arXiv:2005.00547.