Acerca de los Crawlers de Contenido

Cree un crawler de contenido para importar contenido en el portal desde repositorios de contenido externos. Debe ejecutar un trabajo asociado al crawler de contenido para buscar contenido de manera periódica en el repositorio externo e importarlo. Para obtener más información sobre los trabajos, consulte Acerca de los Trabajos.

Nota: Los crawlers de contenido dependen de los orígenes de contenido. Para obtener más información sobre los orígenes de contenido, consulte Acerca de los Orígenes de Contenido.

En este tema se trata la siguiente información:

Para obtener información sobre cómo crear o editar objetos administrativos (incluidos crawlers de contenido), haga clic aquí.

Crawlers de Contenido Web

Un crawler de contenido web permite a los usuarios importar contenido de web en el portal.

Para obtener información sobre el editor de crawlers de contenido web, haga clic en una de las siguientes páginas del editor:

Crawlers de Contenido Remoto

Un crawler de contenido remoto permite a los usuarios importar contenido de un repositorio de contenido externo en el portal.

Algunos proveedores de exploración se instalan con el portal y están disponibles inmediatamente para los usuarios del portal, pero otros requieren que se instalen y configuren manualmente. Por ejemplo, Oracle proporciona los siguientes proveedores de exploración:

Nota: Si lo que desea es información sobre cómo conseguir proveedores de exploración, visite el sitio de Oracle Technology Network en http://www.oracle.com/technology/index.html. Para obtener más información sobre la instalación de proveedores de exploración, consulte la Installation Guide for Oracle WebCenter Interaction (Guía de Instalación de Oracle WebCenter Interaction) (disponible en el sitio de Oracle Technology Network en http://www.oracle.com/technology/documentation/bea.html), la documentación de su proveedor de exploración o bien póngase en contacto con el administrador de su portal.

Para crear un crawler de contenido remoto:

  1. Instale el proveedor de exploración en la computadora del portal o en otra computadora.
  2. Cree un servidor remoto.
  3. Cree un servicio web de contenido (se describe a continuación).
  4. Cree un origen de contenido remoto.
  5. Cree un crawler de contenido remoto.

Para obtener información sobre el editor de crawlers de contenido remoto, haga clic en una de las siguientes páginas del editor:

Los siguientes proveedores de exploración, si se instalan, incluyen al menos una página adicional en el editor de crawlers de contenido remoto:

Servicios Web de Contenido

Los servicios web de contenido permiten especificar la configuración general del repositorio de contenido remoto, dejando que la configuración de destino y seguridad se defina en el origen y el crawler de contenido remoto asociados. Esto permite explorar varias ubicaciones del mismo repositorio de contenido sin tener que especificar repetidamente toda la configuración.

Nota: Debe crear servicios web de contenido en los que basar los orígenes de contenido remotos. Para obtener más información sobre los orígenes de contenido, consulte Acerca de los Orígenes de Contenido.

Para obtener información sobre el editor de servicios web de contenido, haga clic en una de las siguientes páginas del editor:

Importación de la Seguridad de los Documentos

A los usuarios se les puede otorgar acceso automáticamente al contenido importado por crawlers de contenido remoto. La asignación global de sincronización de ACL indica a estos crawlers de contenido cómo importar seguridad de documentos de origen.

Para obtener un ejemplo de cómo funciona la importación de seguridad, consulte Ejemplo de Importación de Seguridad.

Solución de Problemas de los Resultados de las Exploraciones

Compruebe lo siguiente si el crawler de contenido no importa el contenido esperado: