发布时间:2024-10-30 10:01
《诗学含英》此书是按韵分部,包罗天文地理,花木鸟兽,人物器物等的虚实应对。从单字到双字,三字对,五字对,七字对到十一字对,节奏明快琅琅上口,从中可得语音,修辞的训练。
首先,在古诗文网上爬取五类诗歌(边塞征战,写景咏物,山水田园,思乡羁旅,咏史怀古)各600首作为分类模型的训练数据。训练生成FastText分类模型。然后用此分类模型为近30万首诗歌分类。
事先分别为五类诗歌设置15个关键词,然后以维基百科为语料训练得到维基百科的word2vec模型。根据用户输入的主题词,来与各类诗歌的关键词做相似度计算,判断主题词最可能所属的诗歌类别
之后以分好类的五类诗歌为语料,训练得到各自的word2vec模型。判断主题词类别后,以其所属类别的word2vec模型,生成6个与主题词最相似的词,作为后续生成诗歌时,每句开头字的候选集合。
采用深度学习框架tensorflow为五类诗歌分别建立长短期记忆网络模型(LSTM)。把主题词最相似的6个词作为每句诗的开头字的候选集合,并将LSTM模型生成的每个候选字通过《诗学含英》进行概率权重计算,最终选择概率最大的字作为生成字。在生成2/4/6/8句诗歌时,对最后一个字按照《汉字押韵字表》进行押韵筛选过滤,实现诗歌的押韵机制。
以APP的形式与用户进行移动端展示。服务器端用的Flask框架,连接的MySQL数据库,用于保存用户注册的基本信息。在APP的主界面下,用户输入主题词,可选择生成此主题下的五言绝句、五言律诗、七言绝句、七言律诗,随后服务器将生成的诗歌返回到APP的主界面进行展示。
二节:https://blog.csdn.net/turbo_come/article/details/94153192#comments
三节:https://blog.csdn.net/Turbo_Come/article/details/96478565?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
四节:https://blog.csdn.net/Turbo_Come/article/details/99685056?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
五节:https://blog.csdn.net/Turbo_Come/article/details/100033041