要指定内容语言、对被拒绝文档执行的操作以及内容 Crawler 标记,请执行以下操作:
在“内容语言”下面的下拉列表中,选择要导入的大部分内容在编写时所使用的语言。
在“拒绝的文档”下,指定对未成功归类到文件夹中的文档执行的操作:
要仍旧导入这些文档,请选择导入到未分类文档文件夹。
注:具有未分类文档访问权限的用户可以使用“未分类文档”文件夹。要访问未分类文档,请在“目录”菜单中单击编辑目录,然后打开未分类文档文件夹。您还可以单击管理 | 选择实用程序 | 访问未分类文档。
要避免导入这些文档,请选择请勿导入。
如果是编辑现有的内容 Crawler,则将在“拒绝的文档”下看到附加选项,这些选项可用于指定当此内容 Crawler 找到以前被拒绝的文档时应执行的操作。“以前被拒绝”的定义依赖于您在步骤 4b 中选择的选项:
如果选择“由此内容 Crawler 导入”,则以前被拒绝的文档包括由此内容 Crawler 导入但被拒绝的所有文档。
如果选择“从此内容源导入”,则以前被拒绝的文档包括从此内容源导入但被拒绝的所有文档。
指定对以前被拒绝的文档执行哪些操作:
要使此内容 Crawler 尝试导入以前被拒绝的文档,请选择重新导入。
要避免导入这些文档,请选择请勿导入。
如有绝对必要,可以删除以前被拒绝的文档的历史记录。“以前被拒绝”的定义也依赖于您在步骤 4b 中选择的选项。如果在步骤 4b 中选择“从此内容源导入”,则会删除从此内容源导入文档的所有内容 Crawler 的拒绝历史记录。如果您仍确信必须删除以前被拒绝的文档的历史记录,请单击清除拒绝历史记录。
注:如果文档未归类到任何文件夹中,但已放入“未分类文档”文件夹中,则该文档不会计为拒绝的文档。拒绝的文档是指未放入任何文件夹中的文档。
如果是编辑现有的内容 Crawler,则将看到“导入文档”部分。在“导入文档”下,指定是否仅导入新文档。默认情况下,此内容 Crawler 将会尝试仅导入新文档 (即此内容 Crawler 或其他访问同一内容源的内容 Crawler 以前尚未导入的文档)。可以更改内容 Crawler 设置以导入每个文档的多个副本,这在测试内容 Crawler 时非常有用。
要仅导入新文档,请选择仅导入新链接,此时将会显示新选项;否则请跳至步骤 5。
要指定新链接的含义,请执行以下操作:
要仅导入此内容 Crawler 以前尚未导入的那些文档,请选择由此内容 Crawler 导入。
要仅导入未从关联内容源导入的文档 (由此内容 Crawler、其他内容 Crawler 或用户手动导入),请选择从此内容源导入。
注:此处选择的选项会影响步骤 3 和步骤 4f 中的操作。
要根据文档设置页面中指定的设置刷新以前导入的文档,请选择刷新它们。通常,刷新文档是“文档刷新代理”的作业;刷新文档会降低内容 Crawler 的速度。但是,如果更改了此内容 Crawler 的文档设置或更改了关联内容类型中的属性映射,则刷新文档将会更新以前导入的文档的这些设置。
注:如果要搜索 RSS Feed,刷新它们选项将使用目标文档 (而非 RSS Feed) 中的值刷新属性 (例如标题和说明)。如果要保留 RSS Feed 的属性,请勿选择刷新它们。
如果创建了附加文件夹或者对目的地文件夹应用不同筛选器,请选择尝试将它们归类到其他文件夹,将以前导入的文档归类到新的知识目录文件夹中。
其他内容 Crawler 可能已从同一个内容源导入文档,但导入的目的地文件夹与为此内容 Crawler 所指定的不同。请确保您确实要将这些文档重新归类到为此内容 Crawler 指定的目的地文件夹中。
要重新导入以前已删除 (手动删除、由于失效或缺少源文档而删除) 的文档,请选择重新生成已删除的链接。这可能会重新导入曾被认为不适合门户的文档。
如有绝对必要,可以删除已从门户中删除的文档的记录。“历史记录”是根据在步骤 3b 中指定的新文档标准来定义的:
如果选择“由此内容 Crawler 导入”,则历史记录将包括由此内容 Crawler 导入并已删除的所有文档。
如果选择“从此内容源导入”,则历史记录将包括从此内容源导入并已删除的所有文档。因此,将会删除从此内容源导入文档的所有内容 Crawler 的历史记录。
如果您仍确信必须删除已从门户中删除的文档的记录,请单击清除删除历史记录。
要使用内容 Crawler 标记来标记导入的文档,请在使用以下内容 Crawler 标记对导入的文档进行标记框中键入标记。此标记用于区分由此内容 Crawler 导入的文档以及由其他内容 Crawler 导入的文档。
在“运行时配置”下,进行如下设置:
最大文档提取线程数 - 确定用于同时从内容源中提取内容的最大并发线程数。
最大资料卡索引线程数 - 确定在将内容搜索到门户之后,用于同时处理内容的最大并发线程数。
可以在门户配置文件中设置这些字段所允许的范围。此处的设置值还会受到与此内容 Crawler 关联的作业所使用的自动化服务的最大允许线程数的限制。
要显示与此帮助主题相关联的页面,请执行以下操作: