时间:2016年03月31日(校历第5周的周4)下午15:00-15:30
地点:信息工程学院会议室
参加人员:柴变芳,胡吉朝,才秀凤,刘雪静,傅玥,安素芳,陈嶷瑛,许冀伟(共计7人)
总负责人:柴变芳
主题:PLSA模型和算法
内容:
分词工具如何使用,需要完成什么功能。目前只需要实现英文文档的词语切分,获取每个文档中的关键词词频统计。从网上搜集停用词词表,将文档中的停用词去除,剩余的词都作为文档的关键词。文档集合出现的所有关键词作为当前文档集合的词典。还需在以后应用中根据实际任务确认分词词典和停用词。
PLSA模型的参数是否可以采用差分演化算法求解。