1.全唐诗.全唐诗库.唐诗宋词鉴赏.唐诗宋词元曲.唐诗驱鬼李白1.疾风知劲草,板荡识诚臣。 (唐·李世民《赠萧》) 2.海内存知己,天涯若比邻。(唐·王勃《送杜少府之任蜀州》) 3.落霞与孤鹜齐飞,秋水共长天一色。 (唐·王勃《滕王阁序》) 4.海上生明月,天涯共此时。(唐·张九龄《望月怀远》) 5.人世有代谢,往来成古今。 (唐·孟浩然《与诸子登岘山》) 6.大漠孤烟直,长河落日圆。(唐·王维《使之塞上》) 7.独在异乡为异客,每逢佳节倍思亲。 (唐·王维《九月九日忆山东兄弟》) 8.劝君更进一杯酒,西出阳关无故人。(唐·王维《送元二使安西》) 9.洛阳亲友如相问,一片冰心在玉壶。 (唐·王昌龄《芙蓉楼送辛渐》) 10.欲穷千里目,更上一层楼。(唐·王之涣《登鹳雀楼》) 11.莫愁前路无知己,天下谁人不识君。 (唐·高适《别董大》) 12.忽如一夜春风来,千树万树梨花开。(唐·岑参《白雪歌送武判官归京》) 13.马上相逢无纸笔,凭君传语报平安。 (唐·岑参《逢入京使》) 14.近乡情更怯,不敢问来人。(唐·宋三词《渡汉江》) 15.两岸猿声啼不住,轻舟已过万重山。 (唐·李白《早发白帝城》) 16.举头望明月,低头思故乡。(唐·李白《静夜思》) 17.清水出芙蓉,天然去雕饰。 (唐·李白《论诗》) 18.孤帆远影碧空尽,惟见长江天际流。(唐·李白《送孟浩然之广陵》) 19.朱门酒肉臭,路有冻死骨。 (唐·杜甫《自京赴奉先县咏怀怀五百字》) 20.读书破万卷,下笔如有神。(唐·杜甫《奉赠韦左丞丈二十二韵》) 21.为人性僻耽佳句,语不惊人死不休。 (唐·杜甫《江上值水如海势聊短述》) 22.露从今夜白,月是故乡明。(唐·杜甫《月夜忆舍弟》) 23.笔落惊风雨,诗成泣鬼神。 (唐·杜甫《寄李白二十韵》) 24.文章千古事,得失寸心知。(唐·杜甫《偶题》) 25.两句三年得,一吟双泪流。 (唐·贾岛《题诗后》) 26.谁言寸草心,报得三春晖。(唐·孟郊《游子吟》) 27.蚍蜉撼大树,可笑不自量。 (唐·韩愈《调张籍》) 28.不塞不流,不止不行。(唐·韩愈《原道》) 29.业精于勤荒于嬉,行成于思毁于随。 (唐·韩愈《进学解》) 30.李杜文章在,光焰万丈长。(唐·韩愈《调张籍》) 31.衰兰送客咸阳道,天若有情天亦老。 (唐·李贺《金铜仙人辞汉歌》) 32.沉舟侧畔千帆过,病树前头万木春。(唐·刘禹锡《酬乐天扬州初逢席上见赠》) 33.东边日出西边雨,道是无晴却有晴。 (唐·刘禹锡《竹枝词》) 34.山不在高,有仙则名;水不在深,有龙则灵。(唐·刘禹锡《陋室铭》) 35.千淘万漉虽辛苦,吹尽狂沙始到金。 (唐·刘禹锡《浪淘沙》) 36.请君莫奏前朝曲,听曲新翻杨柳枝。(唐·刘禹锡《杨柳枝词九首》) 37.文章合为时而著,歌诗合为事而作。 (唐·白居易《与元九书》) 38.野火烧不尽,春风吹又生。(唐·白居易《赋得古原草送别》) 39.同是天涯沦落人,相逢何必曾相识。 (唐·白居易《琵琶行》) 40.试玉要烧三日满,辩材须待七年期。(唐·白居易《放言》) 41.乱花渐欲迷人眼,浅草才能没马蹄。 (唐·白居易《钱塘湖春行》) 42.醉卧沙场君莫笑,古来征战几人回!(唐·王翰《凉州词》) 43.千里莺啼绿映红,水村山郭酒旗风。(唐·杜牧《江南村绝句》) 44.烟笼寒水月笼沙,夜泊秦淮近酒家。 (唐·杜牧《泊秦淮》) 45.春蚕到死丝方尽,蜡炬成灰泪始干。(唐·李商隐《无题》) 46.身无彩凤双飞翼,心有灵犀一点通。 (唐·李商隐《无题》) 47.相见时难别亦难,东风无力百花残。(唐·李商隐《无题》) 48.夕阳无限好,只是近黄昏。 (唐·李商隐《乐游原》) 49.天意怜幽草,人间重晚晴。(唐·李商隐《晚情》) 50.风暖鸟声碎,日高花影重。 (唐·杜荀鹤《春宫怨》) 51.曾经沧海难为水,除却巫山不是云。(唐·元稹《离思》) 52.姑苏城外寒山寺,夜半钟声到客船。 (唐·张继《枫桥夜泊》) 53.吟安一个字,捻断数茎须。(唐·卢延让《苦吟》) 54.苦恨年年压金线,为他人作稼衣裳(cháng)。 (唐·秦韬玉《贫女》) 55.海阔凭鱼跃,天高任鸟飞。(僧云览诗中之句) 56.溪云初起日沉阁,山雨欲来风满楼。 (唐·许浑《咸阳城东楼》)。 2.全文检索的原理是什么全文检索与之相关的议题语根处理(stemming)符素解析器(tokenparser)1gram,2gram,ngram断词/分词wordsegmentation倒排索引invertedindex算法、搜寻策略之模型布尔式boolean统计模型Probabilisticmodel向量空间模型vectorbasemodel隐性语义模型Latentsemanticmodel全文检索系统检索编辑全文检索评量之准则判断检索效果的两个指标:查全率被检出相关信息量/相关信息总量(%)查准率被检出相关信息量/被检出信息总量(%)全文检索开放源代码之全文检索系统ApacheSolrBaseXClusterpointServer(freewarelicenceforasingleserver)DataparkSearchFerretHt//DigHyperEstraierKinoSearchLemur/IndriLucenemnoGoSearchSphinxSwisheXapianElasticSearch全文检索议题优化编辑全文检索和中文有关的议题断词(分词)语法解析古籍议题多语言混合全文检索优化剔除字(Stopwords)词性标注权威档(authorityfile)知识体系,本体论(ontology)超链接分析(pagerank)技术全文检索历史及未来之趋势自由语句搜寻基于自然语言的分词。 3.如何使用OracleText进行全文检索由于系统中数据不断增多,使得原用的like语法来进行查询法律全文变得十分缓慢,因此在原有系统中增加了全文检索的功能。 全文检索功能依赖于Oracle Text。首先保证Oracle Text组件在数据库中已安装。 然后建立索引 Sql代码 --法律全文内容字段增加索引 create index idx_flqw_nr on flqw(nr) indextype is ctxsys。 context; --法律条款字段增加索引 create index idx_fltk_nr on fltk(nr) indextype is ctxsys。 context; 由于Oracle Text使用的ctxsys。context类型索引不会自动维护,因些需要定时进行更新索引并进行索引优化,索引优化的次数要稍微少些。 Sql代码 --更新索引 exec ctx_ddl。sync_index('idx_flqw_nr'); exec ctx_ddl。 sync_index('idx_fltk_nr'); --优化索引 exec ctx_ddl。optimize_index('idx_flqw_nr','full'); exec ctx_ddl。 optimize_index('idx_fltk_nr','full'); 也可以将更新索引及优化写成job,这样可以定时运行,该job要与用户建立在同一个目录下。 先创建相对应的存储过程。 Sql代码 --给flyy用户赋予在存储过程中执行全文索引的权限 GRANT EXECUTE ANY PROCEDURE TO flyy;。 4.研究诗人诗歌中某个字如何统计,比如李白诗歌中“酒”字的统计,有全唐诗分析系统和全宋词分析系统,似乎中国国家数字图书馆就有。 全唐诗与全宋诗分析系统试用1、产品设计理念全唐诗分析系统与全宋诗分析系统由北京大学数据分析研究中心和欣诺格科技有限公司联合研制。1998年北京大学中文系承担了国家“九五”211项目——《全唐诗电子检索系统》的研发。 项目主持人李铎博士为项目提出了三个目标:一、使用Unicode编码,使全球任何语言版本的操作系统均可正常使用该系统;二、使用XML标记语言,脱离数据库平台,使用最先进的搜索引擎,实现跨平台的多维度检索;三、建设开放的、可扩展的模块化结构,可以任意增减数据。鉴于当初互联网上数据不精,往往给学术研究带来不便的问题,该项目组制定出文本校对高于纸介出版物的标准。 此后,作为211项目子课题,吸收借鉴全唐诗分析系统的成功经验和先进的设计理念,又设计制作了全宋诗分析系统。 5.全宋诗的分析系统该系统由北京大学中文系李铎教授(研究员)主持研发。 2005年1月16日,由中华人民共和国教育部组织召开了北京大学《〈全宋诗〉分析系统》的专家鉴定会,傅璇琮任主任委员。中国古代文学、文献学、语言学、计算机科学界的专家所组成的鉴定委员会认真听取了该项目组的系统研制报告、查新报告、专家测试组的测试报告,并现场观看了系统演示。鉴定委员会经过认真评审、质询答疑,一致认定: 一、由北京大学中文系研制的《〈全宋诗〉分析系统》实现了系统技术方案,达到了该项目预定的各项指标要求。 二、《〈全宋诗〉分析系统》底层主要有以下数据库:1、依据北京大学古文献研究所编纂的《全宋诗》完整数据库;2、北京大学中文系依据《佩文韵府》、《广韵》等韵书建设并扩展的音韵库;3、北京大学中文系李铎完成的教育部科研项目“诗歌模型库”;4、北京大学中文系研制的古代诗人复合称名数据库;5、繁简字一对多关系库。 三、《〈全宋诗〉分析系统》建立在自行研制的数据管理系统基础之上,系统运行效率高、性能稳定、界面友好、加密性能高。 四、《〈全宋诗〉分析系统》突破了以往的全文检索的信息提供模式,在数据深层挖掘和知识发现方面具有开创性意义。其重出诗提取、格律诗标注、字及字组的频率分布统计、用户自作诗的格律分析等带有智能化特点,该系统提供多维的检索分析方式,为中国古代文学、古代汉语、文献学等研究领域提供了可靠的分析数据。它标志着,计算机科学在中文信息处理应用方面由全文检索的信息提供模式开始转向智能分析模式。 鉴定委员会一致认为:《〈全宋诗〉分析系统》是信息处理技术与中国古代文学研究的有效结合,展示出信息技术在中国古代文学研究领域应用的方向和广阔前景,该系统达到了国际领先水平。在信息处理技术与中国古代文学研究结合方面居国际领先地位。 鉴定会员会一致同意通过鉴定。 建议研制单位进一步加强该系统的通用性,形成更强大的中国古代诗歌研究平台,并将其应用于已整理的中国古代诗歌文献数据,如《诗经》、《先秦汉魏六朝诗》、《全唐诗》、《全宋词》等。建议上级单位加强支持力度。 |