CN1629834A - 计算机辅助写作、电子文档的浏览、检索和预订发布 - Google Patents

计算机辅助写作、电子文档的浏览、检索和预订发布 Download PDF

Info

Publication number
CN1629834A
CN1629834A CNA2003101212875A CN200310121287A CN1629834A CN 1629834 A CN1629834 A CN 1629834A CN A2003101212875 A CNA2003101212875 A CN A2003101212875A CN 200310121287 A CN200310121287 A CN 200310121287A CN 1629834 A CN1629834 A CN 1629834A
Authority
CN
China
Prior art keywords
theme
electronic document
user
info
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2003101212875A
Other languages
English (en)
Inventor
刘世霞
杨力平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CNA2003101212875A priority Critical patent/CN1629834A/zh
Priority to US11/016,594 priority patent/US7305406B2/en
Publication of CN1629834A publication Critical patent/CN1629834A/zh
Priority to US11/931,758 priority patent/US7831910B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/912Applications of a database
    • Y10S707/917Text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Abstract

本发明提供了计算机辅助写作的方法、浏览电子文档的方法、辅助写作装置、电子文档的浏览器、检索电子文档的方法、电子文档的检索系统、电子文档的预订发布的方法以及电子文档的预订发布系统。所述计算机辅助写作的方法,包括:在作者写作所述电子文档时,根据所述电子文档生成一个或多个主题摘要;并由作者确保该主题摘要的可靠性;与所述电子文档对应地保存所述主题摘要的信息。

Description

计算机辅助写作、电子文档的浏览、检索和预订发布
技术领域
本发明涉及数据处理技术,特别涉及计算机辅助写作、浏览电子文档、检索电子文档、以及预订发布电子文档的技术。
背景技术
在以往,作者使用的文档写作工具与用户使用的文档管理和检索工具是相互独立的,即,作者在写作时并不关心读者如何来检索和利用他/她所写的内容。但是同时,从信息访问的观点看,用户又会感到很难得到他们真正想要的东西。
而且,由于目前计算机对于自然语言的理解能力还处于字/词理解的水平,而对于文档的管理和检索工具来说,需要句子甚至整篇文章的理解和语义能力,才能够真正满足用户的需要。因此,按照目前的技术发展速度,如果按照现有的文档的写作以及管理、检索方式,可以预计在一个较短的将来内不可能达到用户信息访问的要求。
发明内容
为了解决以上所述现有技术中的问题,本发明提出了作者在写作文档的过程中就为后面文档的管理和检索准备相关的信息,即,为作者提供一套工具来方便地为以后用户的查询、预览作贡献,更具体地说,准备主题摘要。在文本检索中,主题摘要有助于用户快速评价检索结果的相关程度,在信息服务及浏览中,主题摘要有助于多种形式的内容分发,如发往PDA,手机等。
根据本发明的一个方面,提供了一种计算机辅助写作的方法,包括:在作者写作所述电子文档时,根据所述电子文档生成一个或多个主题摘要;与所述电子文档对应地保存所述主题摘要的信息。
根据本发明的另一个方面,提供了一种浏览电子文档的方法,包括:读取与电子文档对应保存的主题摘要信息,所述主题摘要信息包含有一个或多个主题和相应的主题摘要;将所述主题摘要呈现给用户;以及当用户的确认所述主题摘要时,将所述电子文档的内容呈现给用户。
根据本发明的再另一个方面,提供了一种辅助写作装置,包括:电子文档编辑单元,用于编辑电子文档;摘要生成单元,用于根据输入的主题,从所述电子文档中提取主题摘要;以及摘要保存单元,用于与所述电子文档相对应地保存由所述摘要生成单元生成的主题摘要信息。
根据本发明的再另一个方面,提供了一种电子文档的浏览器,包括:主题摘要读取单元,用于读取与所述被浏览的电子文档对应保存的主题摘要信息,所述主题摘要信息包含有一个或多个主题和相应的主题摘要;以及主题摘要呈现单元,用于将所述主题摘要信息中包含的主题摘要呈现给用户。
根据本发明的再另一个方面,提供了一种检索电子文档的方法,包括:提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;对所述提取出的主题摘要信息中的主题编制索引;由用户输入查询;从所述主题索引中找出与所述用户输入的查询最接近的一个或多个主题;将上述最接近的一个或多个主题以及相应的主题摘要呈现给所述用户;以及将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
根据本发明的再另一个方面,提供了一种检索电子文档的方法,包括:在根据用户的查询查找到一个或多个电子文档时,读取这些查找到的电子文档对应的主题摘要信息,其中每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户;以及将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
根据本发明的再另一个方面,提供了一种电子文档的检索系统,包括:主题摘要信息提取装置,用于提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;主题索引装置,用于对所述提取出的主题摘要信息中的主题编制索引;主题索引库,用于保存由所述主题索引装置编制的主题索引;主题查找装置,用于从所述主题索引中找出与用户输入的查询最接近的一个或多个主题;主题摘要呈现装置,用于将由所述主题查找装置找出的一个或多个主题以及相应的主题摘要呈现给所述用户;以及电子文档提供装置,用于将所述用户选择的主题摘要所对应的电子文档或者链接提供给所述用户。
根据本发明的再另一个方面,提供了一种电子文档的检索系统,所述检索系统用于根据用户的查询查找一个或多个电子文档,所述系统包括:主题摘要读取装置,用于读取所述查找到的电子文档对应的主题摘要信息,其中每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;主题摘要呈现装置,用于将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户;以及电子文档提供装置,用于将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
根据本发明的再另一个方面,提供了一种电子文档的预订发布的方法,包括:  建立订户的简档,该简档中包含所述订户希望的预订主题;提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;根据所述订户简档中的预订主题,选择相关的主题和相应的主题摘要;以及将选中的主题摘要发布给所述订户。
根据本发明的再另一个方面,提供了一种电子文档的预订发布系统,包括:订户简档存储装置,用户保存订户的简档,该简档中包含所述订户希望的预订主题;主题摘要信息提取装置,用于提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;主题选择装置,用于根据所述订户简档中的预订主题,选择相关的主题和相应的主题摘要;以及订户发布装置,用于将由所述主题选择装置选择的主题摘要发布给所述订户。
附图说明
相信通过以下结合附图对本发明具体实施方式的说明,能够使人们更好地了解本发明上述的特点、优点和目的。
图1是根据本发明的一个实施例的计算机辅助写作的方法的流程图;
图2是根据本发明的一个实施例的浏览电子文档的方法的流程图;
图3是展示根据本发明的一个实施例的辅助写作装置的结构的方块图;
图4是展示根据本发明的一个实施例的电子文档的浏览器的结构的方块图;
图5是根据本发明的一个实施例的检索电子文档的方法的流程图;
图6是根据本发明的另一个实施例的检索电子文档的方法的流程图;
图7是展示根据本发明的一个实施例的电子文档的检索系统的结构的方块图;
图8是根据本发明的一个实施例的电子文档的预订发布的方法的流程图;以及
图9是展示根据本发明的一个实施例的电子文档的预订发布系统的结构的方块图。
具体实施方式
下面就结合附图对本发明的各个优选实施例进行详细的说明。
计算机辅助写作的方法
根据本发明的一个方面,提供了一种计算机辅助写作的方法。图1是根据本发明的一个实施例的计算机辅助写作的方法的流程图。
如图1所示,首先,在步骤101,作者写作电子文档。通常,主题摘要的生成是在作者写完一篇文档时进行,当然,根据实际情况也可以在完成文档的一部分(例如一个章节)时进行。
接着,在步骤105,由作者输入一个主题,或者根据写作的文档利用算法自动生成一个主题。在此,主题(topic)可以是一个或多个关键词(keyword)或者自然语言查询(NL query),其中主题中去掉停用词(stopword)的关键词称作主题词(topic term)。优选地,由作者输入主题,因为作者可以根据其写作意图来决定最能代表该文档主要内容的主题。如果是自动生成主题,则可以采用在文档中关键词出现的频率或者其他信息提取技术来生成主题。
接着,在步骤110,根据该主题从电子文档(或文档段)中提取主题摘要。根据本发明的一个实施例可以通过以下方法来根据主题从文档中提取主题摘要:
a)计算文档(或者文档段)中每个词(不包括停用词)的重要性(权重),例如,利用if-idf方法的公式1:
     wj=tf·idf                           (1)
在公式1中,tf是该词在该文档中的出现的频率(次数),idf=all_sentences/term_sentences;其中,all_sentences是该文档中全部句子的数量,term_sentences是其中包含该词的句子的数量。
b)计算每个句子的重要性,即将一个句子的全部词的权重相加,例如用公式2:
valu e i = Σ w j ∈ S i w j - - - ( 2 )
c)计算文档中每个句子与所述主题的相关性,例如可以利用以下公式3:
score i = n 2 q - - - ( 3 )
在公式3中,n是在该句子中出现的主题词的次数,q是该主题中主题词的个数。
d)将上述句子的重要性和与主题的相关性结合起来,例如利用下面公式4,来计算每个句子的综合分值:
     ri=λ·scorei+(1-λ)·valuei             (4)
在公式4中,λ是一个0和1之间的系数,用来调整在结合句子的重要性和相关性时的比例,根据本发明的一个优选实施例,可以将其设为0.9,从而强调与主题的相关性。
e)将上述计算出的综合分值最大的预定数量的句子选择作为主题摘要。
应当理解,以上只是举例说明的一种提取主题摘要的方法,还有各种其他根据主题提取摘要的方法,例如,直接列出包含主题词的句子、使用模板来产生摘要等等,这些方法也多可以适用于本发明。并且,上面虽然是出了计算句子重要性、相关性和综合分值的公式1~4,但是这些公式的形式和其中的系数是可以作出各种变化的。
进而,在根据主题生成摘要时,还可以利用各种改善摘要可读性的技术,例如,共同申请人的中国专利申请“用于改善由机器自动生成的摘要的可读性的方法和装置”(申请号:200310101752.9),其内容被全部包含于此以供参考。
再回到图1,接着在步骤115,由作者核实该主题摘要。在此,“核实”包括作者查看、修改生成的主题摘要,从而保证最终的主题摘要是准确地、完整地反映该文档内容的。
然后,在步骤120,判断是否希望为更多的主题生成主题摘要。通常,一篇文档会包含许多方面的内容,同样读者在查找和阅读文档时会有各种不同目的。因此,如果在本步骤判断为还有更多的主题应当反映的话,就返回到步骤105,输入下一个主题并提取与该主题对应的摘要;如果没有其他主题需要提取了,再向下进行到步骤125。
在步骤125,与该电子文档对应地保存主题摘要信息。具体地,根据本法明的优选实施例,可以将主题摘要信息作为知识标记(knowledge tag)与电子文档一起保存,例如,在电子文档的结尾处附加:
<TopicSummary>
    <Topic1>Rocket</Topic1>
    <Summary1>Yao Ming scored all 18 of his points in the first half and reserve Maurice Taylor had 11
    of his 17 points in the fourth quarter in the Houston Rockets′105-90 victory over the Los Angeles
    Clippers 105-90 Monday night.</Summary1>
    <Topic2>Laker</Topic2>
    <Summary2>Kobe Bryant scored 28 points,Karl Malone had 20 points and 10 rebounds and Gary
    Payton added 17 points and 10 assists to lead the Los Angeles Lakers to a 121-89 drubbing of the
    Memphis Grizzlies on Sunday night.</Summary2>
    ……
</TopicSummary>
也可以在电子文档的头部定义主题摘要知识标记标记类型,在电子文档的正文中利用该标记指明摘要包含的句子的方式。
如前面所述,本发明没有对主题摘要信息的具体保存方式进行限定,例如,可以与电子文档一起保存,即,作为电子文档的一部分,也可以分开保存,只要能够与所述电子文档相对应即可。
通过以上对本实施例的描述可知,如果采用本实施例的辅助写作方法,则可以辅助作者在写作的过程中完成多个主题摘要的准备,在不过多增加作者负担的情况下,利用作者对于该文档的理解(这肯定是最准确的理解),来保证生成主题摘要的准确性和可读性。并且,因为可以为一个文档生成可以充分反映该文档内容的多个主题摘要(例如,一篇关于NBA的报道中可能包含火箭、湖人、公牛等多个球队以及多个球员的情况,相应地可以生成相应主题的摘要),因此在利用这些主题摘要信息进行检索和预览时,可以更准确和全面,从而得到高的用户满意度。
另外,根据本发明的一个实施例,在作者核实该主题摘要之后,对经作者核实、修改之后的主题摘要进行评估,以评价其可靠性。具体地,可以利用多种摘要生成方法(摘要引擎)生成多个摘要,并分别计算这些摘要与作者核实过的摘要的相关程度,将这些相关程度值的加权和,作为该核实后的摘要的准确性量度。并且,在后的面步骤125中,也将该准确性信息作为主题摘要信息的一部分保存。这样,可以客观地反映该主题摘要的可靠性。
浏览电子文档的方法
在同一发明构思下,根据本发明的另一个方面,提供了一种浏览电子文档的方法,该电子文档是通过上述计算机辅助写作的方法产生的文档,即,与该文档对应地保存有主题摘要信息。
图2是根据本发明的一个实施例的浏览电子文档的方法的流程图。如图2所示,首先在步骤201,读取电子文档的主题摘要信息。具体地,根据保存主题摘要信息的方式,将主题摘要信息读出,例如,如果主题摘要信息是被保存在文档的尾部作为知识标记,则相应地识别出该知识标记并将其中信息读出。
接着,在步骤205,将主题摘要信息中的主题摘要呈现给用户。具体地,可以有多种方式来呈现主题摘要。最直接的方式是将每个主题和相应主题摘要依次列出。但是,当主题摘要的数量很大时,也可以由用户输入希望的主题,然后从所述主题摘要信息中包含的多个主题中选择与用户输入的主题最接近的主题,再将所述最接近的主题的主题摘要显示给用户。
接着,在步骤210,读者查看主题摘要,并判断是否对该文档感兴趣。如果读者对该文档感兴趣,则确认并进入到步骤215,将该文档的内容呈现给读者;如果读者对该文档不感兴趣,则不显示文档内容,而进行到步骤220,关闭文档结束。
通过以上对本实施例的描述可知,如果采用本实施例的浏览电子文档的方法,则可以利用由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息,在将文档全部内容呈现给读者之前,将由作者核实过的相关主题的摘要提供给读者观看,让读者了解他所关心的主题在该文档中的大致内容,从而可以节省读者的阅读时间。
辅助写作装置
在同一发明构思下,根据本发明的另一个方面,提供了一种辅助写作装置。图3是展示根据本发明的一个实施例的辅助写作装置的结构的方块图。
如图3所示,该辅助写作装置300,包括:电子文档编辑单元301,用于编辑电子文档,它可以是一个独立的文档编辑单元,也可以共用已有的文档编辑器,例如,MS Word或WPS等等;摘要生成单元302,用于根据输入的主题,从电子文档中提取主题摘要;摘要保存单元306,用于与电子文档相对应地保存由摘要生成单元302生成的主题摘要信息;摘要评价单元305,用于允许作者对由摘要生成单元302生成的主题摘要进行评价、修改;摘要缓存304,用于临时保存由摘要生成单元302生成的主题摘要。
本实施例的辅助写作装置300,在操作上,可以实现前面描述的计算机辅助写作方法。
相应地,辅助写作装置300还可以包括:准确性计算单元,用于评价所述经过作者核实的摘要的准确性。其中,摘要生成单元302还可以包括:句子重要性计算装置,用于计算所述文档中每个句子的重要性;句子相关性计算装置,用于计算所述文档中每个句子与所述主题的相关性;句子提取装置,用于结合所述计算出来的每个句子的重要性和相关性、选择预订数量的句子。
通过以上对本实施例的描述可知,如果采用本实施例的辅助写作装置,则可以辅助作者在写作的过程中完成多个主题摘要的准备,在不过多增加作者负担的情况下,利用作者对于该文档的理解(这肯定是最准确的理解),来保证生成主题摘要的准确性和可读性。并且,因为可以为一个文档生成可以充分反映该文档内容的多个主题摘要,因此在利用这些主题摘要信息进行检索和预览时,可以更准确和全面,从而得到高的用户满意度。
电子文档的浏览器
在同一发明构思下,根据本发明的另一个方面,提供了一种电子文档的浏览器,该电子文档是通过上述计算机辅助写作的方法产生的文档,即,与该文档对应地保存有主题摘要信息。
图4是展示根据本发明的一个实施例的电子文档的浏览器的结构的方块图。如图4所示,本实施例的电子文档浏览器400,包括:电子文档浏览单元401,用于浏览电子文档的内容,它可以是一个现有技术中的浏览器,例如,MS Internet Explorer,Netscape Navigator,Acrobat Reader等等;
主题摘要信息读取单元402,用于读取与所述电子文档对应保存的主题摘要信息,具体地,根据保存主题摘要信息的方式,将主题摘要信息读出,例如,如果主题摘要信息是被保存在文档的尾部作为知识标记,则相应地识别出该知识标记并将其中信息读出;
主题摘要呈现单元403,用于将由主题摘要信息读取单元402读取的主题摘要信息中的主题摘要呈现给用户,具体地,可以有多种方式来呈现主题摘要。最直接的方式是将每个主题和相应主题摘要依次列出。但是,当主题摘要的数量很大时,也可以由用户输入希望的主题,然后从所述主题摘要信息中包含的多个主题中选择与用户输入的主题最接近的主题,再将所述最接近的主题的主题摘要显示给用户,这时,该浏览器400还包含一个主题选择单元(未图示),用于从所述主题摘要信息中包含的多个主题中选择与用户输入的主题最接近的主题。
通过以上对本实施例的描述可知,本实施例的电子文档浏览器可以实施本发明上述浏览电子文档的方法。如果采用本实施例的电子文档浏览器,则可以利用由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息,在将文档全部内容呈现给读者之前,将由作者核实过的相关主题的摘要提供给读者观看,让读者了解他所关心的主题在该文档中的大致内容,从而可以节省读者的阅读时间。
检索电子文档的方法
在同一发明构思下,根据本发明的另一个方面,提供了一种检索电子文档的方法,其中电子文档是通过上述计算机辅助写作的方法产生的文档,即,与该文档对应地保存有主题摘要信息。
图5是根据本发明的一个实施例的检索电子文档的方法的流程图。如图5所示,首先在步骤501,提取与多个电子文档对应的主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要。具体地,如果电子文档的作者是使用上述辅助写作装置300写作文档的,则每个电子文档都会有一个与其对应的主题摘要信息。在本步骤中,就是将多个电子文档的主题摘要信息提取出来。特别地对于在因特网上发布的电子文档,可以通过网络搜索器(web crawler)来遍历各个电子文档,并提取其对应的主题摘要信息,例如从知识标记中提取。
接着,在步骤505,对提取出的主题摘要信息中的主题编制索引。在此,可以使用信息检索领域中常用的各种索引方法来对这些主题摘要信息中的主题编制索引,例如,倒排文件、签名文件、PAT树或PAT阵列等。
接着,在步骤510,由用户输入自己的查询。与主题一样,用户的查询可以是一个或多个关键词(keyword)或者问题。
接着,在步骤515,找出与用户输入的查询接近的一个或多个主题。具体地,本步骤可以包括:计算用户输入的查询与主题索引中各个主题的相关程度,以及将上述相关程度最高的一个或者相关程度大于一个预定阈值的主题选择出来。
然后,在步骤520,将上述最接近的一个或多个主题以及相应的主题摘要呈现给所述用户,并且,在步骤525,当用户选择了其中一个主题摘要时,将用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
通过以上对本实施例的描述可知,本实施例的检索电子文档的方法,可以利用由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息,将这些主题摘要信息提取出来,用于用户的查询。由于主题摘要信息中的主题和相应的摘要,是经过作者核对的,可以保证其准确性和可读性,因此,本实施例的检索电子文档的方法可以更准确,进而在将文档全部内容呈现给读者之前,将由作者核实过的相关主题的摘要提供给读者观看,让读者了解他所关心的主题在该文档中的大致内容,从而可以节省读者的查找时间。
图6是根据本发明的另一个实施例的检索电子文档的方法的流程图。其中电子文档是通过上述计算机辅助写作的方法产生的文档,即,与该文档对应地保存有主题摘要信息。
图6所示的方法,与现有技术的电子文档检索方法一样,在步骤601,根据用户的查询查找电子文档,例如,利用已有的全文检索、关键词检索等等。
所不同的是,在向用户提供检索结果预览时,首先,步骤605读取这些查找到的电子文档对应的主题摘要信息,其中每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要。
接着,在步骤610,将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户。具体判断最接近主题的方法前面已经进行了描述在此不再重复说明。
然后,在步骤615,如果用户选择了其中一个主题摘要,则将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
通过以上对本实施例的描述可知,本实施例的检索电子文档的方法,可以利用由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息,在将文档全部内容呈现给读者之前,将由作者核实过的相关主题的摘要提供给读者观看,让读者了解他所关心的主题在该文档中的大致内容,从而可以节省读者的查找时间。
电子文档的检索系统
在同一发明构思下,根据本发明的另一个方面,提供了一种电子文档的检索系统,其中电子文档是通过上述计算机辅助写作的方法产生的文档,即,与该文档对应地保存有主题摘要信息。
与前面图5所示的检索方法相对应,图7是展示根据本发明的一个实施例的电子文档的检索系统的结构的方块图。
如图7所示,电子文档的检索系统700,包括:主题摘要信息提取装置701,用于提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要,如前所述,主题摘要信息提取装置701可以是一个网络搜索器(web crawler)来遍历网络上的各个电子文档,并提取其对应的主题摘要信息;主题索引装置702,用于对所述提取出的主题摘要信息中的主题编制索引;主题索引库703,用于保存由主题索引装置702编制的主题索引;主题查找装置706,用于从主题索引库703的主题索引中找出与用户输入的查询最接近的一个或多个主题;主题摘要呈现装置705,用于将由主题查找装置706找出的一个或多个主题以及相应的主题摘要呈现给用户;电子文档提供装置704,用于将用户选择的主题摘要所对应的电子文档或者链接提供给所述用户。
进而,检索系统700还可以包括:相关度计算装置(未图示),用于计算两个词语串的相关程度;从而,主题查找装置706,利用该相关度计算装置,计算用户输入的查询与主题索引中各个主题的相关程度,并且将上述相关程度最高的一个预定数量或者相关程度大于一个预定阈值的主题选择出来。
通过以上对本实施例的描述可知,本实施例的电子文档的检索系统可以实现前面结合图5所述的电子文档检索方法,可以将由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息用于用户的查询。由于主题摘要信息中的主题和相应的摘要,是经过作者核对的,可以保证其准确性和可读性,因此,本实施例的电子文档的检索系统可以更准确检索,进而在将文档全部内容呈现给读者之前,将由作者核实过的相关主题的摘要提供给读者观看,让读者了解他所关心的主题在该文档中的大致内容,从而可以节省读者的查找时间。
另外,为了实现前面图6所示的检索方法,可以在现有技术的用于根据用户的查询查找一个或多个电子文档的检索系统中增加设置:主题摘要读取装置,用于读取查找到的电子文档对应的主题摘要信息,其中每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;主题摘要呈现装置,用于将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户;电子文档提供装置,用于将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
进而,该检索系统也可以包括一个相关度计算装置,用于计算两个词语串的相关程度;从而,所述主题摘要呈现装置,利用所述相关度计算装置,对每个所述主题摘要信息计算用户输入的查询与主题摘要信息中各个主题的相关程度,将上述相关程度最高的一个主题的主题摘要呈现给所述用户。
本实施例的电子文档的检索系统可以实现前面结合图6所述的电子文档检索方法,可以利用由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息,在将文档全部内容呈现给读者之前,将由作者核实过的相关主题的摘要提供给读者观看,让读者了解他所关心的主题在该文档中的大致内容,从而可以节省读者的查找时间。
电子文档的预订发布的方法和系统
在同一发明构思下,根据本发明的另一个方面,提供了一种电子文档的预订发布的方法和系统,其中电子文档是通过上述计算机辅助写作的方法产生的文档,即,与该文档对应地保存有主题摘要信息。
通常,发布(publish)/订阅(subscribe)系统由内容提供者、订户(subscriber)客户机以及发布-订阅服务器构成。内容提供者产生通过发布-订阅系统分发的内容。内容提供者向发布-订阅服务器发送结构化的内容。订户客户机向发布-订阅服务器发送订阅请求,并以订户简档的方式记录订户的希望主题,订户从发布-订阅服务接收内容。所收到的实际内容将决定于订阅和消息选择过程。共同申请人的中国专利申请“从公布/订阅服务接收电子消息的方法和系统”(申请号:03149816.7)中公开了这样的发布-预订系统和方法,其全部内容被包含于此以供参考。
图8是根据本发明的一个实施例的电子文档的预订发布的方法的流程图。如图8所示,首先在步骤801,提取与多个电子文档对应的主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要。与前面图5中的步骤501一样,如果电子文档的作者是使用上述辅助写作装置300写作文档的,则每个电子文档都会有一个与其对应的主题摘要信息。在本步骤中,就是将多个电子文档的主题摘要信息提取出来。特别地对于在因特网上发布的电子文档,可以通过网络搜索器(web crawler)来遍历各个电子文档,并提取其对应的主题摘要信息,例如从知识标记中提取。
接着,在步骤805,将前面步骤提取出的主题摘要信息作为选择对象,根据订户简档选择相关的主题。具体地,例如可以先计算订户简档中的预订主题与所述主题摘要信息中各个主题的相关程度,然后将相关程度大于一个预定阈值的主题和相应的主题摘要选择出来。在此,本发明的电子文档的预订发布的方法与现有技术的主要区别在于,将主题摘要信息作为选择对象,而对于选择过程则可以利用已知的各种方式,例如,中国专利申请03149816.7号中公开的方式。
然后,在步骤810,将选中的主题和相应的摘要发布给订户。
通过以上对本实施例的描述可知,本实施例的电子文档的预订发布的方法,可以利用由本发明前述的辅助写作方法编制的电子文档中的主题摘要信息,将这些主题摘要信息提取出来,用于选择与订户简档匹配的摘要。由于主题摘要信息中的主题和相应的摘要,是经过作者核对的,可以保证其准确性和可读性,因此,本实施例的电子文档的预订发布的方法可以更准确。
图9是展示根据本发明的一个实施例的电子文档的预订发布系统的结构的方块图。如图9所示,电子文档的预订发布系统900,包括:订户简档存储装置903,用于保存订户的简档,该简档中包含所述订户希望的预订主题;主题摘要信息提取装置901,用于提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;主题摘要缓存902,用于临时保存由主题摘要信息提取装置901提取出的主题摘要信息;主题选择装置905,用于根据订户简档存储装置中保存的订户简档中的预订主题,选择主题摘要缓存902中保存的相关的主题和相应的主题摘要;订户发布装置904,用于将由主题选择装置905选择的主题摘要发布给所述订户。
进而,该电子文档的预订发布系统900还可以包括一个相关度计算装置(未图式),用于计算两个词语串的相关程度。主题选择装置905,利用该关度计算装置,计算订户简档中的预订主题与提取的主题摘要信息中各个主题的相关程度,并且将上述相关程度大于一个预定阈值的主题和相应的主题摘要选择出来。
本实施例的预订发布系统,可以实施前面描述的电子文档的预订发布方法,从而可以更准确地向订户发布相关信息。
本发明的上述辅助写作装置、电子文档的浏览器、电子文档的检索系统、电子文档的预订发布系统以及它们各自的组成部分可以以硬件和软件方式实现,并且根据需要可以和其他装置结合,例如,可以实现在个人计算机、笔记本计算机、掌上型计算机、PDA、文字处理机等各种带有计算功能的设备上,并且可以物理地分离而操作上互相连接完成功能。
以上虽然通过一些示例性的实施例对本发明的计算机辅助写作的方法、浏览电子文档的方法、辅助写作装置、电子文档的浏览器、检索电子文档的方法、电子文档的检索系统、电子文档的预订发布的方法以及电子文档的预订发布系统进行了详细的描述,但是以上这些实施例并不是穷举的,本领域技术人员可以在本发明的精神和范围内实现各种变化和修改。因此,本发明并不限于这些实施例,本发明的范围仅由所附权利要求为准。

Claims (29)

1.一种计算机辅助写作的方法,其特征在于,包括:
在作者写作所述电子文档时,根据所述电子文档生成一个或多个主题摘要;以及
与所述电子文档对应地保存所述主题摘要的信息。
2.根据权利要求1所述的计算机辅助写作的方法,其特征在于,所述生成一个或多个主题摘要的每一个的步骤,包括:
输入或者生成一个主题,所述主题包含一个或多个主题词;以及
根据所述主题从所述电子文档中提取摘要。
3.根据权利要求2所述的计算机辅助写作的方法,其特征在于,所述根据所述主题从所述电子文档中提取摘要的步骤,包括:
计算所述文档中每个句子的重要性;
计算所述文档中每个句子与所述主题的相关性;以及
结合所述计算出来的每个句子的重要性和相关性,选择预定数量的句子作为所述主题的摘要。
4.根据权利要求2所述的计算机辅助写作的方法,其特征在于,进一步包括:
从与所述被选择的句子相邻的句子中,选择与所述被选择的句子相关性高的句子纳入所述主题的摘要中。
5.根据权利要求2所述的计算机辅助写作的方法,其特征在于,所述生成一个或多个主题摘要的步骤,进一步包括:
核实所述提取出的摘要。
6.根据权利要求5所述的计算机辅助写作的方法,其特征在于,所述生成一个或多个主题摘要的步骤,进一步包括:评价所述经过核实的摘要的准确性;
其中,所述保存所述主题摘要的步骤,进一步保存所述摘要的准确性信息。
7.根据权利要求6所述的计算机辅助写作的方法,其特征在于,所述评价所述经过核实的摘要的准确性的步骤包括:
利用不同的摘要生成方法为所述主题生成多个参考摘要;
计算所述核实的摘要与所述生成的多个参考摘要之间的相关程度;以及
根据这些相关程度计算所述核实的摘要的准确性。
8.根据权利要求1所述的计算机辅助写作的方法,其特征在于,所述与所述电子文档对应地保存所述主题摘要的信息的步骤,包括:
将所述主题摘要信息作为知识标记保存在所述电子文档中。
9.根据权利要求1所述的计算机辅助写作的方法,其特征在于,所述与所述电子文档对应地保存所述主题摘要的信息的步骤,包括:
将所述主题摘要信息保存为与所述电子文档相关联的知识标记文件。
10.一种浏览电子文档的方法,其特征在于,包括:
读取与电子文档对应保存的主题摘要信息,所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
将所述主题摘要呈现给用户;以及
当用户确认所述主题摘要时,将所述电子文档的内容呈现给用户。
11.根据权利要求10所述的浏览电子文档的方法,其特征在于,所述主题摘要信息中包含多个主题和相应的主题摘要;其中,所述将所述主题摘要呈现给用户的步骤,包括:
由用户输入希望的主题;
从所述主题摘要信息中包含的多个主题中选择与用户输入的主题最接近的主题;以及
将所述最接近的主题的主题摘要呈现给用户。
12.一种辅助写作装置,其特征在于,包括:
电子文档编辑单元,用于编辑电子文档;
摘要生成单元,用于根据输入的主题,从所述电子文档中提取主题摘要;以及
摘要保存单元,用于与所述电子文档相对应地保存由所述摘要生成单元生成的主题摘要信息。
13.根据权利要求12所述的辅助写作装置,其特征在于,进一步包括:
摘要评价单元,用于允许作者对由所述摘要生成单元生成的主题摘要进行评价、修改。
14.根据权利要求13所述的辅助写作装置,其特征在于,进一步包括:
准确性计算单元,用于评价所述经过核实的摘要的准确性。
15.根据权利要求12所述的辅助写作装置,其特征在于,所述摘要生成单元,包括:
句子重要性计算装置,用于计算所述文档中每个句子的重要性;
句子相关性计算装置,用于计算所述文档中每个句子与所述主题的相关性;以及
句子提取装置,用于结合所述计算出来的每个句子的重要性和相关性、选择预订数量的句子。
16.一种电子文档的浏览器,其特征在于,包括:
主题摘要读取单元,用于读取与所述被浏览的电子文档对应保存的主题摘要信息,所述主题摘要信息包含有一个或多个主题和相应的主题摘要;以及
主题摘要呈现单元,用于将所述主题摘要信息中包含的主题摘要呈现给用户。
17.根据权利要求16所述的电子文档的浏览器,其特征在于,进一步包括:主题选择单元,用于从所述主题摘要信息中包含的多个主题中选择与用户输入的主题最接近的主题;
其中,所述主题摘要呈现单元,只将所述最接近的主题的主题摘要呈现给用户。
18.一种检索电子文档的方法,其特征在于,包括:
提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
对所述提取出的主题摘要信息中的主题编制索引;
由用户输入查询;
从所述主题索引中找出与所述用户输入的查询最接近的一个或多个主题;
将上述最接近的一个或多个主题以及相应的主题摘要呈现给所述用户;以及
将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
19.根据权利要求18所述的检索电子文档的方法,其特征在于,所述找出与所述用户输入的查询最接近的一个或多个主题的步骤,包括:
计算用户输入的查询与主题索引中各个主题的相关程度;以及
将上述相关程度最高的一个预定数量或者相关程度大于一个预定阈值的主题选择出来。
20.一种检索电子文档的方法,其特征在于,包括:
在根据用户的查询查找到一个或多个电子文档时,读取这些查找到的电子文档对应的主题摘要信息,其中每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户;以及
将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
21.根据权利要求20所述的检索电子文档的方法,其特征在于,所述将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户的步骤,包括:
对于每个所述主题摘要信息,计算用户输入的查询与主题摘要信息中各个主题的相关程度,将上述相关程度最高的一个主题的主题摘要呈现给所述用户。
22.一种电子文档的检索系统,其特征在于,包括:
主题摘要信息提取装置,用于提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
主题索引装置,用于对所述提取出的主题摘要信息中的主题编制索引;
主题索引库,用于保存由所述主题索引装置编制的主题索引;
主题查找装置,用于从所述主题索引中找出与用户输入的查询最接近的一个或多个主题;
主题摘要呈现装置,用于将由所述主题查找装置找出的一个或多个主题以及相应的主题摘要呈现给所述用户;以及
电子文档提供装置,用于将所述用户选择的主题摘要所对应的电子文档或者链接提供给所述用户。
23.根据权利要求22所述的电子文档的检索系统,其特征在于,进一步包括:相关度计算装置,用于计算两个词语串的相关程度;
其中,所述主题查找装置,利用所述相关度计算装置,计算用户输入的查询与主题索引中各个主题的相关程度,并且将上述相关程度最高的一个预定数量或者相关程度大于一个预定阈值的主题选择出来。
24.一种电子文档的检索系统,所述检索系统用于根据用户的查询查找一个或多个电子文档,其特征在于,包括:
主题摘要读取装置,用于读取所述查找到的电子文档对应的主题摘要信息,其中每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
主题摘要呈现装置,用于将每个所述主题摘要信息中包含的与所述用户查询最接近的一个主题的主题摘要呈现给所述用户;以及
电子文档提供装置,用于将所述用户选择的主题摘要对应的电子文档或者链接提供给所述用户。
25.根据权利要求22所述的电子文档的检索系统,其特征在于,进一步包括:相关度计算装置,用于计算两个词语串的相关程度;
所述主题摘要呈现装置,利用所述相关度计算装置,对每个所述主题摘要信息计算用户输入的查询与主题摘要信息中各个主题的相关程度,将上述相关程度最高的一个主题的主题摘要呈现给所述用户。
26.一种电子文档的预订发布的方法,其特征在于,包括:
建立订户的简档,该简档中包含所述订户希望的预订主题;
提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
根据所述订户简档中的预订主题,选择相关的主题和相应的主题摘要;以及
将选中的主题摘要发布给所述订户。
27.根据权利要求26所述的电子文档的预订发布的方法,其特征在于,所述选择相关的主题和相应的主题摘要的步骤,包括:
计算所述订户简档中的预订主题与所述主题摘要信息中各个主题的相关程度;以及
将上述相关程度大于一个预定阈值的主题和相应的主题摘要选择出来。
28.一种电子文档的预订发布系统,其特征在于,包括:
订户简档存储装置,用户保存订户的简档,该简档中包含所述订户希望的预订主题;
主题摘要信息提取装置,用于提取分别与多个电子文档对应的多个主题摘要信息,每个所述主题摘要信息包含有一个或多个主题和相应的主题摘要;
主题选择装置,用于根据所述订户简档中的预订主题,选择相关的主题和相应的主题摘要;以及
订户发布装置,用于将由所述主题选择装置选择的主题摘要发布给所述订户。
29.根据权利要求28所述的电子文档的预订发布系统,其特征在于,进一步包括:相关度计算装置,用于计算两个词语串的相关程度;
其中,所述主题选择装置,利用所述相关度计算装置,计算所述订户简档中的预订主题与由所述主题摘要信息提取装置提取的主题摘要信息中各个主题的相关程度,并且将上述相关程度大于一个预定阈值的主题和相应的主题摘要选择出来。
CNA2003101212875A 2003-12-17 2003-12-17 计算机辅助写作、电子文档的浏览、检索和预订发布 Pending CN1629834A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CNA2003101212875A CN1629834A (zh) 2003-12-17 2003-12-17 计算机辅助写作、电子文档的浏览、检索和预订发布
US11/016,594 US7305406B2 (en) 2003-12-17 2004-12-17 Computer aided authoring, electronic document browsing, retrieving, and subscribing and publishing
US11/931,758 US7831910B2 (en) 2003-12-17 2007-10-31 Computer aided authoring, electronic document browsing, retrieving, and subscribing and publishing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2003101212875A CN1629834A (zh) 2003-12-17 2003-12-17 计算机辅助写作、电子文档的浏览、检索和预订发布

Publications (1)

Publication Number Publication Date
CN1629834A true CN1629834A (zh) 2005-06-22

Family

ID=34716085

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2003101212875A Pending CN1629834A (zh) 2003-12-17 2003-12-17 计算机辅助写作、电子文档的浏览、检索和预订发布

Country Status (2)

Country Link
US (2) US7305406B2 (zh)
CN (1) CN1629834A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046329A (zh) * 2015-08-25 2015-11-11 长沙市麓智信息科技有限公司 专利撰写系统
CN110264792A (zh) * 2019-06-17 2019-09-20 上海元趣信息技术有限公司 一种针对小学生作文智能辅导系统

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734613B2 (en) * 2005-11-03 2010-06-08 International Business Machines Corporation Enabling a user to create a mini information center thereby reducing the time needed for the user to obtain the desired information
US7814102B2 (en) * 2005-12-07 2010-10-12 Lexisnexis, A Division Of Reed Elsevier Inc. Method and system for linking documents with multiple topics to related documents
US20080070526A1 (en) * 2006-09-15 2008-03-20 Contenta Llc Method and system for distributing mobile book messages
US7895197B2 (en) * 2007-04-30 2011-02-22 Sap Ag Hierarchical metadata generator for retrieval systems
US8229736B2 (en) * 2008-04-16 2012-07-24 International Business Machines Corporation Transforming a natural language request for modifying a set of subscriptions for a publish/subscribe topic string
US8984398B2 (en) * 2008-08-28 2015-03-17 Yahoo! Inc. Generation of search result abstracts
US8234274B2 (en) * 2008-12-18 2012-07-31 Nec Laboratories America, Inc. Systems and methods for characterizing linked documents using a latent topic model
US20100169317A1 (en) * 2008-12-31 2010-07-01 Microsoft Corporation Product or Service Review Summarization Using Attributes
US9135326B2 (en) * 2009-12-10 2015-09-15 Nec Corporation Text mining method, text mining device and text mining program
GB2498966A (en) * 2012-02-01 2013-08-07 Qatar Foundation Article summaries using metadata
US20130262431A1 (en) * 2012-03-27 2013-10-03 Roku, Inc. Method and Apparatus for Identifying and Recommending Content
US9137578B2 (en) 2012-03-27 2015-09-15 Roku, Inc. Method and apparatus for sharing content
US8627388B2 (en) 2012-03-27 2014-01-07 Roku, Inc. Method and apparatus for channel prioritization
US8938755B2 (en) 2012-03-27 2015-01-20 Roku, Inc. Method and apparatus for recurring content searches and viewing window notification
US8977721B2 (en) 2012-03-27 2015-03-10 Roku, Inc. Method and apparatus for dynamic prioritization of content listings
US9519645B2 (en) 2012-03-27 2016-12-13 Silicon Valley Bank System and method for searching multimedia
US11468243B2 (en) * 2012-09-24 2022-10-11 Amazon Technologies, Inc. Identity-based display of text
US10019716B1 (en) * 2013-11-21 2018-07-10 Google Llc Method for feedback submission resolution
US9721207B2 (en) * 2014-05-27 2017-08-01 International Business Machines Corporation Generating written content from knowledge management systems
US11461533B2 (en) * 2014-10-15 2022-10-04 International Business Machines Corporation Generating a document preview
KR101656245B1 (ko) * 2015-09-09 2016-09-09 주식회사 위버플 문장 추출 방법 및 시스템
US10936695B2 (en) * 2016-08-02 2021-03-02 International Business Machines Corporation Collaboration system to share tailored information with social networks
US20190129591A1 (en) * 2017-10-26 2019-05-02 International Business Machines Corporation Dynamic system and method for content and topic based synchronization during presentations
JP2022061606A (ja) * 2020-10-07 2022-04-19 株式会社東芝 文書検索装置、方法、プログラムおよび学習装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6356898B2 (en) * 1998-08-31 2002-03-12 International Business Machines Corporation Method and system for summarizing topics of documents browsed by a user
WO2001056388A2 (en) 2000-02-04 2001-08-09 General Dynamics Information Systems, Inc. Annotating semantic ontologies
US20020078090A1 (en) * 2000-06-30 2002-06-20 Hwang Chung Hee Ontological concept-based, user-centric text summarization
WO2002063493A1 (en) * 2001-02-08 2002-08-15 2028, Inc. Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication
JP4630480B2 (ja) * 2001-03-19 2011-02-09 株式会社東芝 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム
US7376893B2 (en) * 2002-12-16 2008-05-20 Palo Alto Research Center Incorporated Systems and methods for sentence based interactive topic-based text summarization

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046329A (zh) * 2015-08-25 2015-11-11 长沙市麓智信息科技有限公司 专利撰写系统
CN110264792A (zh) * 2019-06-17 2019-09-20 上海元趣信息技术有限公司 一种针对小学生作文智能辅导系统
CN110264792B (zh) * 2019-06-17 2021-11-09 上海元趣信息技术有限公司 一种针对小学生作文智能辅导系统

Also Published As

Publication number Publication date
US20090024610A1 (en) 2009-01-22
US7831910B2 (en) 2010-11-09
US7305406B2 (en) 2007-12-04
US20050154702A1 (en) 2005-07-14

Similar Documents

Publication Publication Date Title
CN1629834A (zh) 计算机辅助写作、电子文档的浏览、检索和预订发布
US10270791B1 (en) Search entity transition matrix and applications of the transition matrix
JP4726528B2 (ja) マルチセンスクエリについての関連語提案
US9697249B1 (en) Estimating confidence for query revision models
CN1629833A (zh) 实现问与答功能和计算机辅助写作的方法及装置
US8768922B2 (en) Ad retrieval for user search on social network sites
US7739264B2 (en) System and method for generating substitutable queries on the basis of one or more features
US7519588B2 (en) Keyword characterization and application
US7958128B2 (en) Query-independent entity importance in books
CA2774278C (en) Methods and systems for extracting keyphrases from natural text for search engine indexing
US20060230022A1 (en) Integration of multiple query revision models
Jones et al. Query word deletion prediction
US20120303444A1 (en) Semantic advertising selection from lateral concepts and topics
CN110637316B (zh) 用于预期对象识别的系统和方法
CA2577376A1 (en) Point of law search system and method
US20080222138A1 (en) Method and Apparatus for Constructing a Link Structure Between Documents
JP2008511075A5 (zh)
CN1609845A (zh) 用于改善由机器自动生成的摘要的可读性的方法和装置
WO2009059297A1 (en) Method and apparatus for automated tag generation for digital content
US20100293062A1 (en) Advertisement selection based on key words
US20110313843A1 (en) Search advertisement targeting
CN1955960A (zh) 文档信息表构造装置以及利用其的浏览和查找系统
Materne et al. Methods of ranking search results for searches based on multiple search concepts carried out in multiple databases
CN1629835A (zh) 电子文档的计算机辅助写作和浏览的方法及装置
CN1871601A (zh) 将文档与上下文广告相关联的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication