最新消息

阅读更多

最新消息

阅读更多

最新照片分享

阅读更多

研讨会内容

研讨会名称【生物统计中心讲座】《课程一》R软件在中文文字探勘的应用(14:00-16:30 ) 《课程二》文字挖掘的在各领域的应用(16:30-17:30)
开始日期2015-06-29 14:30:00
结束日期2015-06-22 17:30:00
活动说明《课程一》
【主题】:R软件在中文文字探勘的应用
【课程介绍】:「文字探勘」(Text Mining) 是利用资料探勘以及其他技术于文字资料分析的特殊技术。文字探勘的主要功能是从非结构化或半结构化文件、甚至是音樂、图档、影片中,撷取隐晦有用的片段、模型或规則,以及尚未被发掘、有潜在价值的信息或知识。此外,由于中文不像英文一样容易斷词,加上中文文法的差异,中文文字探勘并不像英文文字探勘那么容易入门。
除了商业文字探勘软件之外,国内外各界目前广泛使用R软件来作文字探勘的分析任务。我们将介绍R软件在中文文字探勘的应用,包含中文斷词、语料库的建构、文件與词汇的分群與分类、主题模型区分,以及情感分析或舆情分析的应用。
【讲师简介】:陈景祥 副教授 (淡江大學统计系)
【时 间】:104年6月29日(ㄧ) 14:00-16:30
【地 点】:口腔医學院二楼阶梯教室

《课程二》
【主题】文字挖掘的在各领域的应用
【课程介绍】由于计算机及网络的快速发展,过去传统纸质書面资料大多变成电子档的形式呈现,因此资料的取得比过去要容易许多,大多訊息都可由網站搜寻获得。但是这些文字资料通常是以半结构化或非结构化的形式储存。“非结构化资料”是指一般的档,其内容没有一定的格式,每份资料间没有共同的结构性,却不一定能发现档中所隐藏的訊息,容易忽略某些对我们有用的重要信息。
文字挖掘(TextMining)主要定义为“从非结构化的文字中发掘有用的片段、模型、方向、趋势或规則”,另外也有學者定义为:“是一种编辑、组织及分析大量档的方法和过程。”一般的统计分析或资料采撷的方法,只适用于结构化的关联表格资料,无法直接運用到非结构的档资料上,而一些已发表的文本挖掘研究中结合了信息检索(Information Retrieval)、自然语言处理(Natural Language Processing)和语义分析技术,試图从档资料中找出重要的专案(Term)、词组(Phrase)、项目间的关联強度(Association Degree)。
在现今充满着大数据的时代中,除了能利用量化的资料去分析外,质化的资料中更含有大量的信息,如何利用「多维度分析」去帮客户创造价值,正是TextMining的所用之处。并利用文字挖掘分析结果,得出资料价值。并透过各领域的应用,如:商品销售、行销导购、社群操作、危机预警、选战策略、社会网络等。帮企业及客户创造价值與利益。
【讲师简介】:谢邦彦 讲师
【时 间】:104年6月29日(ㄧ) 16:30-17:30
【地 点】:口腔医學院二楼阶梯教室


【对象】全校教职员、三院同仁及學生
【承办单位】生物统计研究中心
【联絡窗口】曾馨颉(ext8678)
主要联絡Mailatzeng@tmu.edu.tw
参考连结
附件档案