创建内容 Crawler 后,可以从外部内容资料档案库将内容导入到您的门户。必须运行与内容 Crawler 关联的作业,以定期搜索外部资料档案库中的内容并导入该内容。有关作业的信息,请参阅关于作业。
注:内容 Crawler 基于内容源。有关内容源的信息,请参阅关于内容源。
此主题介绍以下信息:
要了解如何创建或编辑管理对象 (包括内容 Crawler),请单击此处。
Web 内容 Crawler 使用户能够将内容从 Web 导入到门户。
要了解 Web 内容 Crawler 编辑器,请单击以下编辑器页之一:
远程内容 Crawler 使用户能够将内容从外部内容资料档案库导入到门户。
一些搜索提供方可随门户一起安装,并且可随时供门户用户使用,但其他提供方则需要手动安装和设置。例如,Oracle 提供了以下搜索提供方:
注:有关获取搜索提供方的信息,请参阅 Oracle 技术网,网址为 http://www.oracle.com/technology/index.html。有关安装搜索提供方的信息,请参阅 Oracle 技术网上的 Installation Guide for Oracle WebCenter Interaction,网址为 http://www.oracle.com/technology/documentation/bea.html;或参阅搜索提供方随附的文档,或者与门户管理员联系。
要创建远程内容 Crawler,请执行以下操作:
要了解远程内容 Crawler 编辑器,请单击以下编辑器页之一:
如果安装了以下搜索提供方,它们至少包含一个远程内容 Crawler 编辑器的附加页面:
通过内容 Web 服务可以指定远程内容资料档案库的常规设置,而将目标和安全性设置留在关联的远程内容源和远程内容 Crawler 中进行设置。这样可以搜索同一内容资料档案库的多个位置,而不必重复指定所有设置。
注:可以创建作为远程内容源基础的内容 Web 服务。有关内容源的信息,请参阅关于内容源。
要了解内容 Web 服务编辑器,请单击以下编辑器页之一:
用户可以自动获得对某些远程内容 Crawler 导入的内容的访问权限。全局 ACL 同步映射显示了这些内容 Crawler 如何导入源文档安全性。
有关如何导入安全性的示例,请参阅导入安全性示例。
如果内容 Crawler 未导入预期内容,则应该检查以下几个方面:
确保文件夹筛选器能够正确筛选内容。要了解筛选器测试,请参阅“主要设置 (筛选器)”页面上的测试筛选器。
确保内容 Crawler 未将不需要的内容放入目标文件夹。如果文档未被筛选到任何子文件夹,内容 Crawler 可能会将该文档放入目标文件夹。这取决于文件夹编辑器的主要设置页面中的设置。
确保内容 Crawler 未将内容放入“未分类文档”文件夹。如果无法将某个文档放入任何目标文件夹或子文件夹,内容 Crawler 可能会将该文档放入“未分类文档”文件夹。这取决于内容 Crawler 编辑器的高级设置页面上的设置。如果您具有正确的权限,则可在编辑“目录”时查看“未分类文档”文件夹,或者通过单击管理 | 选择实用程序 | 访问未分类文档来查看。
确保您对目标文件夹至少具有“编辑”访问权限。
对于 Web 内容 Crawler,确保自动排除协议以及任何排除或包含操作不会妨碍内容 Crawler 导入预期内容。这取决于内容 Crawler 编辑器的 Web 页排除页面上的设置。
确保关联内容源中指定的验证信息允许门户访问内容。
有关附加信息,请查看作业历史记录。