El uso de la información como una ventaja estratégica en varios sectores ha creado una industria en sí misma en donde podemos encontrar empresas editoras, agregadores de contenidos, empresas que ofrecen servicios de información estadísticos y econométricos, datos de investigación de mercado y de información competititva, en definitiva un amplio conjunto de empresas que van desde players globales a empresas de nicho para proporcionar cualquier tipo de información a sus clientes: información financiera, legal, médica, información sobre los mercados de explotación de petróleo y gas, etc.
Todas estas empresas tienen algo en común: el volumen de información que han de gestionar crece exponencialmente. Debido a que la mayor parte de la información es de acceso público el valor percibido por sus clientes de sus servicios depende en gran medida del grado de calidad en la elaboración de la información. Con la excepción de los proveedores de servicios financieros la mayoría de estas empresas hacen uso de procesos manuales para el tratamiento y gestión de la información.
Aprenda cómo la virtualización de datos puede utilizarse para integrar servicios de información y servicios en la nube en su organización. La virtualización de datos se ha convertido en una herramienta esencial para agregar, virtualizar y entregar servicios de datos para una amplia gama de servicios de información a gran escala. Con esta tecnología se automatizan procesos manuales de tratamiento de datos, tareas de recolección de información para poder escalar en el servicio y permitir que el staff editorial pueda centrarse en mejorar la calidad de la información y ofrecer realmente valor añadido. No obstante, no todas las herramientas de virtualización de datos son útiles en este sector, sólo aquéllas que disponen de capacidades avanzadas de extracción web, capacidad de integración semántica y tratamiento de fuentes semiestructuradas y no estructuradas de forma conjunta a los datos estructurados, aquéllas con fuertes capacidades de búsqueda textual y la capacidad de entregar formatos jerárquicos y semánticos a su salida.
De forma creciente las empresas de servicios de información y servicios en la nube utilizan la virtualización de datos en procesos de información claves, así como en funciones de inteligencia de negocio corporativa:
Datos canónicos para desarrollo ágil de servicios y productos
El proveedor líder de datos en el sector de la energía disponía de cientos de bases de datos segmentadas en docenas de tipos de datos diferentes (pozos de explotación petrolífera y de gas, producción de petróleo, distribución, información sísmica, precios, etc.) y ubicados en silos de información en diferentes geografías y compartimentados a lo largo de su organización. Esta situación favorecía que los clientes tuviesen que subscribirse a diferentes servicios cuando lo que querían era información sobre una región geográfica en particular o sobre un pozo o campo de explotación concreto. Así mismo, la empresa pretendía ofrecer servicios más estratégicos basados en productos derivados de la aplicación de modelos de análisis y valoración (e.g. valoración de activos de explotación) que fuesen más allá de la venta de datos en crudo. La virtualización de datos ha ayudado a alcanzar ambos objetivos ya que mediante la construcción de una capa de abstracción entre los repositorios físicos y los servicios de datos, se ha conseguido que esta capa se convierta en el “goto” para los equipos de desarrollo de nuevos productos y servicios.
Extracción de datos de fuentes web y no estructuradas para big data
Una empresa que ofrece servicios de información en muchos sectores de actividad industriales en más de 40 países se encontró con un incremento sin precedentes en la demanda de sus servicios debido a los cambios sociales y regulatorios, lo que le originó numerosos desafíos de escalabilidad para la automatización de la recopilación de información. La unidad de servicios de información del área de la salud disponía de una base de datos de contenidos con más de 10 millones de documentos que debía ser constantemente actualizada mediante procesos de extracción web, inicialmente manuales y posteriormente basados en scripts PERL, muy difíciles de escalar y de evolucionar debido a las dificultades de automatizar el acceso a webs en constante evolución tecnológica. Esta situación impactaba en la satisfacción de sus clientes y por consiguiente en sus resultados. Con la tecnología de virtualización de datos consiguieron automatizar el acceso a sitios Web dinámicos mediante la automatización de flujos de navegación similares a los que realiza una persona cuando se conecta a la web (rellenando formularios, recuperando resultados, navegando sobre enlaces dinámicos, etc.), y recuperar y presentar la información de una forma totalmente estructurada, con una fiabilidad y un rendimiento garantizados. Gracias a esta implantación la empresa puede ahora explorar nuevas oportunidades en el mercado.
Servicios analíticos de big data para el sector de la venta y la distribución
La analítica sobre el consumo en el sector del Retail es una de los sectores más activos en la analítica de big data. Una empresa que proporciona servicios analíticos para grandes empresas de retail y empresas de consumo (Consumer Packaged Goods), incluyendo análisis del tráfico en las tiendas y en sus sitios web, ratios de conversión de visitas físicas y en la web a ventas, predicción de tendencias sociales, provisión de datos de salud pública y climatológicos que influyen en las campañas de anuncios publicitarios, etc., ha implantado la tecnología de virtualización de datos. Esta empresa hace uso de la virtualización de datos para conseguir agilidad en la ingesta de nuevos datos e integrarlos con los ya existentes en vistas canónicas sin impactar los sistemas en origen.
Servicios de geo-navegación en la nube
El líder en plataformas de geo-posicionamiento y navegación que se utilizan en los equipos móviles de hoy en día, en la automoción y en otras aplicaciones, deseaba enriquecer su oferta de servicios basados en la localización con información en tiempo real contextual procedente de las redes sociales. La Virtualización de datos ofrece una capa de servicios de datos lógica que combina la información de posicionamiento en determinados puntos de interés, con información semi-estática relativa a ofertas, horarios, precios, etc., de una gran variedad de proveedores, así como información recogida en tiempo real de forma dinámica de sitios web sociales con el objetivo de proporcionar un e-commerce contextual. Ello ha permitido a la compañía proporcionar servicios “win-to-win” a sus clientes y a sus socios con una mayor agilidad y a un menor coste.
Beneficios de la virtualización de datos de Denodo para los servicios de información y servicios en la nube
- 3 de los 5 mayores proveedores de servicios de información a escala mundial utilizan la Plataforma Denodo para la extracción de datos Web, la agregación de datos y la provisión de servicios de datos, en diversos ámbitos como el legal, financiero, médico, energético, automoción, ciencias de la vida y el consumo.
- La plataforma Denodo es la única plataforma de virtualización que ofrece integración bi-direccional con páginas Web dinámicas, integración de formularios semi-estructurados, índices de búsqueda invertidos y la capacidad de estructurar documentos semi-estructurados y no estructurados (cuando presentan algún tipo de estructura que pueda inferirse o algún tipo de patrón en los contenidos), así como ficheros PDFs como fuentes. Dispone de capacidades de integración semánticas para combinar datos textuales con información estructurada. Es así mismo la única plataforma de virtualización de datos que acepta consultas semánticas de forma adicional a consultas SQL o sobre web services.
- La plataforma Denodo puede integrar datos de la nube, ser desplegada en la nube y entregar servicios de datos para la nube, ofreciendo con ello total flexibilidad a los proveedores de servicios en la nube.