sábado, 11 de mayo de 2013

Business Intelligence


BUSINESS INTELLIGENCE




¿Qué es Business Intelligence? Business Intelligence es un mercado que tiene como objetivo facilitar el acceso y análisis de la información corporativa y proporcionar las herramientas tecnológicas adecuadas para la toma de decisiones. Desde mi punto de vista, la palabra clave en todo esto es "análisis", y es lo que lo diferencia esencialmente de otros sistemas donde lo primordial es ejecutar los procesos operacionales de la compañía (crear pedidos, emitir facturas, dar de alta clientes, etc...).

En cuanto a las herramientas y metodologías de Business Intelligence, tienen algunas características comunes:

  • Accesibilidad a la información. Sin información, sin datos, no hay nada que estudiar. Estas herramientas y técnicas garantizan el acceso a los datos por parte de los usuarios.

  • Apoyo en toma de decisiones. Acceso a herramientas de análisis que permitan a los usuarios seleccionar y manipular aquellos datos que les interesen.

  • Orientación al usuario final. Se busca independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.


Existen muchas maneras de analizar la información, y por este motivo existen un conjunto de soluciones que resuelven las diferentes necesidades analíticas. Concretamente, las soluciones que se encuadran dentro del amplio concepto BI son las siguientes:

  • Reporting: Herramientas para generación de listados, etc.

  • Análisis OLAP: Exploración, tablas dinámicas, etc.

  • EIS: Soluciones que permiten visualizar, de una forma rápida y fácil, el estado de una determinada situación empresarial, presente o pasada, y que permite detectar anomalías o oportunidades.

  • DSS: Aplicación informática que basándose en modelos matemáticos y mediante análisis de sensibilidad permite ayudar a la toma de decisiones (What-if?, etc.)

  • Data mining (¿o sistemas expertos?): Herramientas diseñadas para resolver problemas concretos que requieran muchos cálculos y análisis . Por ejemplo, una entidad financiera podría tener un ES para valorar la concesión o denegación de un crédito. Otro ejemplo: Un supermercado podría tener una aplicación de “basket analysis” diseñada para detectar productos que se compran conjuntamente.
  • KMS: Incipiente tecnología que pretender facilitar el acceso la información corporativa (¡incluyendo la información no estructurada!). Me lo imagino como un "Google" donde poniendo el nombre de la cliente, por ejemplo, devolviese toda la información relevante de ese cliente (últimas compras, documentos donde se hable de dicho cliente, noticias, estado de sus pedidos, etc.).

sábado, 4 de mayo de 2013

Recuperación de información en los buscadores

RECUPERACIÓN DE INFORMACIÓN EN LOS BUSCADORES



En Internet resulta difícil encontrar una información pertinente y fiable.

Para encontrarla, hay que partir de unos conocimientos previos sobre las herramientas de búsqueda que hay a nuestra disposición, saber qué tipo de información queremos y utilizar la herramienta idónea para el tipo de información buscada. Es a estos elementos o conjuntos de herramientas que podemos llamar Sistemas de Recuperación de la Información en Internet.


Hoy hablaremos de la recuperación de información en los buscadores.




Los motores de búsqueda se basan en un robot o software que recorre la red automáticamente para localizar documentos, los indiza y los introduce en una base de datos. Esta base de datos será interrogada por los usuarios a través de un formulario, que lanza la búsqueda, la compara con los recursos indizados en la base de datos y devuelve como resultado un conjunto de links.


La forma de búsqueda en estos sistemas es a través de palabras clave introducidas en el formulario de consulta, permitiendo la mayoría de ellos realizar búsquedas simples y avanzadas. Las búsquedas suelen ser más exhaustivas que en los directorios, pero por el contrario devuelven entre los resultados información que no nos es muy útil. Son útiles para responder a necesidades concretas de información.



Funcionamiento de los Motores de Búsqueda:


Un motor de búsqueda en Internet se compone de diversos elementos, los cuales serán evaluables, a la hora de valorar su rendimiento o utilidad a la hora de satisfacer una demanda de información:


  • El robot que recorre Internet para localizar direcciones y documentos y que genera una base de datos textual.
  • Un sistema de indización automática, según distintos criterios (full-text, parcial o utilizando las etiquetas propias del lenguaje de marcas).
  • Un sistema de interrogación: que incluye un lenguaje de consulta y una serie de procedimientos más o menos documentales para precisarlas.
  • Un interface: evaluable tanto a nivel de página de consulta, como a nivel de presentación de resultados.

Modelos de recuperación de la información




Bajo el término modelos de recuperación se engloban todas aquellas técnicas que tienen por objetivo facilitar el proceso de comparación entre una consulta determinada y un conjunto de textos sobre los que se realiza la consulta. Se trata de herramientas muy utilizadas dentro del campo de la recuperación y organización de la información.


Hoy en día, los buscadores son las herramientas más utilizadas en el ámbito de Internet para acceder de forma rápida a la información sobre un determinado tema. Por ello, parece conveniente conocer cuáles son los principales modelos de recuperación utilizados por los buscadores para permitir el acceso a la información de una consulta.


Presentaremos cuatro tipos de modelos de recuperación clásicos:


  • Modelo booleano: Se basa en un criterio de decisión binario (pertinente o no pertinente) para saber si un documento tiene relación con una pregunta.
  • Modelo vectorial: Trabaja asignando pesos no binarios a los términos índice de las preguntas y de los documentos. Estos pesos se utilizan para comprobar el grado de similitud entre un documento guardado en el sistema y la pregunta realizada por el usuario.
  • Modelo probabilístico: Se basa en el cálculo de la probabilidad de que un documento se corresponda con un pregunta.
  • Modelo Relevance Feedback: Modelo que trata de refinar las búsquedas a partir de los términos más relevantes en búsquedas anteriores.


Estos modelos de recuperación están pensados únicamente para documentos de contenido textual.


Técnicas y métodos de recuperación de información en internet.





Las aproximaciones a la Recuperación de la Información en Internet pueden establecerse según la creación de recursos, o según la herramienta utilizada. Ambos enfoques, al igual que en casos anteriores no son excluyentes.


  • Según la creación del recurso:


La creación de listados, índices y catálogos ordenados por áreas o materias, de forma que el usuario dispusiese de un conjunto de fuentes seleccionadas en las que empezar a buscar. El ejemplomáss conocido es el norteamericano Yahoo!. Han ido añadiendo motores internos a sus prestaciones de forma que permiten consultar mediante ecuaciones sus bases de datos.
La creación automática de bases de datos basadas en índices o ficheros inversos, mediante unas aplicaciones que rastrean o exploran todo el ámbito Web, llamados robots, spiders o wanderers. Estos robots rastrean el Web a la búsqueda de documentos, obtienen una copia, la indizan, y usan los enlaces presentes en los mismos para localizar nuevos documentos


  • Según la herramienta utilizada:


    • Directa:


El navegador se conecta al servidor Web que actúa como interfaz del motor de búsqueda correspondiente a la base de datos que desea consultar. El servidor le envía una página Web que actúa como interfaz de interrogación, a través de la cual formula la consulta. El servidor la recibe, procesa y envía como respuesta una nueva página Web, generada de forma dinámica, que contiene las respuestas más pertinentes a la ecuación formulada por el usuario


    • Por intermediario:
   
El navegador se conecta a un servidor Web que le ofrece una interfaz de interrogación propia. Esta interfaz le permite interrogar una base de datos correspondiente a un motor de búsqueda situado en un servidor Web diferente al que ofrece la interfaz. La interfaz actúa como intermediario entre el motor de búsqueda de destino y el usuario. El interés de estos intermediarios (meta buscadores) se da cuando consultan a múltiples motores de búsqueda.


    • Por agente:


El usuario instala en su computador una aplicación que permite formular las ecuaciones de búsqueda y remitirlas a uno o varios motores de búsqueda. La aplicación lanza conexiones simultáneas al conjunto de motores que se trate, recibe las respuestas, y las entrega al usuario en una presentación única que puede ofrecer diferentes formas. Finalmente y dependiendo de las prestaciones del agente, las respuestas pueden ser filtradas, aplicando criterios propios de eliminación de duplicados, reordenación de resultados, etc.


    • Por robot personal:
Se trata de aplicaciones que se instalan en el computador del usuario, y que son capaces de acceder a un servidor Web, construir un mapa de índices de sus contenidos, y utilizar los mismos para acceder a la información que sea interesante para el usuario, obteniendo copias de las páginas o documentos Web contenidos en el mismo.



sábado, 20 de abril de 2013

Los Buscadores

LOS BUSCADORES



 
Los buscadores nos los podemos encontrar en un sitio o página web, y los cuales se encargan de, por medio de palabras clave, operar en una base de datos del propio buscador y mostrarnos todas las páginas posibles relacionadas con esa información.


Los buscadores los podemos clasificar en varios tipos, dependiendo del tipo , ya sea por  navegación o por búsqueda, el método de navegación consiste en seguir links creados por otros usuarios hacia otras páginas, y el método de búsqueda es usar un buscador que busca palabras clave como antes hemos comentado.


Los buscadores más usados tienen las siguientes características:




DIRECTORIOS TEMÁTICOS


Son la base de datos menos actualizada y más elaborada a diferencia de las demás, estos buscadores se encargan de organizar la información por temas. Son fáciles de usar, ya que la información está muy  bien organizada. Entre ellos podemos encontrar:




Open Directory - http://dmoz.org





MOTORES DE BÚSQUEDA


Sus bases de datos son las más actualizadas y amplias, estos recogen toda la información de la red y la colocan sin orden a diferencia de los  directorios temáticos, pero sin embargo la colocan de forma automática. Son más difíciles de usar en comparación a los directorios temáticos, ya que requiere la exploración de más enlaces e ir descartando posibilidades hasta dar con una respuesta. Entre ellos podemos encontrar:








METABUSCADORES


A diferencia de todos los buscadores mencionados anteriormente, estos no tienen base de datos, y por tanto no almacenan información, sino que buscan automáticamente en las bases de datos de otros buscadores. Para localizar la información envían las solicitudes a los otros buscadores (siempre y cuando estén disponibles), y recibes la información deseada. Entre ellos podemos encontrar:


Metacrawler - http://metacrawler.com


NetLocator - http://nln.com





LOS BUSCADORES MÁS USADOS EN 2013

 

sábado, 23 de marzo de 2013

Los Sistemas de Almacenamiento Actuales



LOS SISTEMAS DE ALMACENAMIENTO ACTUALES
 
En los anteriores post, hemos tratado temas relacionados con la obtención y tratamiento de la información, hoy hablaremos de dónde podemos almacenarla hoy en día.



Estos dispositivos o sistemas de almacenamiento actuales se pueden dividir en dos grandes grupos, los cuales son físicos(tangibles) y virtuales(intangibles).



Sistemas de almacenamiento físicos:



  • Dispositivos magnéticos:


    • Disco duro: Son en la actualidad el principal subsistema de almacenamiento de información en los sistemas informáticos. Es un dispositivo encargado de almacenar información de forma persistente en un ordenador, es considerado el sistema de almacenamiento más importante del ordenador ya que almacena toda la información que tenemos en él.



  • Dispositivos ópticos:
   
    • CD (Compact Disc): puede almacenar hasta unos 700 MB. Se diferencian 4 tipos, de lectura (CD-ROM), grabable(CD-R), regrabable(CD-RW) o de audio (CD-A).


    • DVD (Digital Video Disc): tiene mayor capacidad que el CD, ya que dependiendo del tipo que sea, puede almacenar hasta 17,1 GB. Se diferencian 4 tipos, de lectura (DVD-ROM), grabable(DVD-R), regrabable(DVD-RW) o de doble capa(DVD-DL).


    • Blu-ray Disc: son los que actualmente están empezando a reemplazar a los DVD, y tienen una capacidad de hasta 50 GB dependiendo de su tipo.( si solo es de una cara, tiene 25 GB).



  • Tarjetas de memoria:


Una tarjeta de memoria o tarjeta de memoria flash es un dispositivo de almacenamiento que conserva la información que le ha sido almacenada de forma correcta aun con la pérdida de energía, es decir, es una memoria no volátil.
En la siguiente tabla podemos observar todos los tipos de tarjetas de memoria que existen en la actualidad.





  • Memorias USB:


    • Pendrive: Se compone de una memoria flash y se conecta a través de un puerto USB. Tiene un pequeño y compacto tamaño, y tiene infinidad de capacidades, desde unos pocos MB hasta cientos de GB. Es la memoria portátil más utilizada en la actualidad.


Sistemas de almacenamiento virtual:


  • Almacenamiento en la nube o Cloud storage: Es uno de los sistemas que actualmente están cobrando más fuerza. En el, los datos están alojados en espacios de almacenamiento virtualizados. Lo bueno de estos sistemas es poder acceder a la información desde cualquier lugar, sin necesidad de tener una memoria física. Y sin duda hoy en día el sistema más empleado de este tipo es DropBox, así como en un pasado lo fue megaupload.



También existen otros tipos de sistemas de almacenamiento, los cuales son las bases de datos, que podrían situarse en los dos grupos, los cuales son las bases de datos, y que hoy día se utilizan en todos los lugares.

Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar fácilmente. A continuación te presentamos una guía que te explicará el concepto y características de las bases de datos.

viernes, 8 de marzo de 2013

Los lenguajes de programación más actuales

LOS LENGUAJES DE PROGRAMACIÓN MÁS ACTUALES Y POPULARES



Comencemos definiendo lo que es un lenguaje de programación.

Un lenguaje de programación es un idioma artificial diseñado para expresar procesos que pueden ser llevadas a cabo por máquinas, como los ordenadores.

Pueden usarse para crear programas que realicen una determinada función en la máquina.

Está formado por un conjunto de símbolos y reglas sintácticas y semánticas que definen su estructura y el significado de sus elementos y expresiones.


A continuación hablaremos de los lenguajes de programación más actuales, haciendo un breve repaso de cada uno, y cuales son sus principales funciones. Lo haremos comenzando por el más popular, y continuaremos en orden descendiente.

Java

 


Fue desarrollado en 1991 por Sun Microsystems, se trata de un lenguaje de programación orientado a objetos que se conocido hoy día como Java. El objetivo de este lenguaje en un principio era utilizarlo en un set-top box (un tipo de dispositivo que encarga de la recepción y la decodificación de la señal televisiva). En primer lugar comenzó llamándose Oak, más tarde se le llamó Green y finalmente se pasó a llamar Java.

La intención fue era crear un lenguaje con una estructura y una sintaxis similar a C y C++, aunque con un modelo de objetos más simple y eliminando las herramientas de bajo nivel.

Los pilares principales de Java son cinco: la programación orientada a objetos, la posibilidad de ejecutar un mismo programa en diversos sistemas operativos, la inclusión por defecto de soporte para trabajo en red, la opción de ejecutar el código en sistemas remotos de manera segura y la facilidad de uso.

PHP


PHP es un lenguaje que une interpretación y compilación para intentar ofrecer a los programadores la unión entre rendimiento y flexibilidad.

PHP compila una serie de instrucciones (llamadas opcodes) para tu código siempre que estas son accedidas. Estas instrucciones son entonces ejecutadas una por una hasta que el script termina. Esto es diferente a la compilación de lenguajes como C++ donde el código es compilado a un código ejecutable que es después ejecutado. Php es re compilado cada vez que se solicita un script.

Una ventaja importante de interpretar el código es que toda la memoria usada por tu código es manejada por PHP, y el lenguaje automáticamente vacía esta memoria cuando el script finaliza. Esto significa que las conexiones a la base de datos las hará PHP por ti.

C/C++


El lenguaje C es un lenguaje de “medio nivel” pero con numerosas características de bajo nivel.
Dispone de las estructuras típicas de los lenguajes de alto nivel pero, a su vez, dispone de construcciones del lenguaje que permiten un control a muy bajo nivel.

El C++ es un lenguaje de programación, diseñado a mediados de los años 1980, por Bjarne Stroustrup, el cual surgió como extensión del lenguaje C.

C++ es un lenguaje que abarca tres características principales: la programación estructurada, la programación genérica y la programación orientada a objetos.

Las principales características del C++ son las facilidades que proporciona para la programación orientada a objetos y para el uso de plantillas o programación genérica.
Además posee una serie de propiedades difíciles de encontrar en otros lenguajes de alto nivel:

  • Posibilidad de redefinir los operadores (sobrecarga de operadores)
  • Identificación de tipos en tiempo de ejecución (RTTI)

Python
 

Python es un lenguaje de programación interpretado cuya filosofía hace hincapié en una sintaxis muy limpia y que favorezca un código legible.

Se trata de un lenguaje de programación multiparadigma, ya que soporta orientación a objetos, programación imperativa y, en menor medida, programación funcional. Es un lenguaje interpretado, usa tipado dinámico y es multiplataforma.

¿Y TÚ, QUÉ LENGUAJE DE PROGRAMACIÓN CONSIDERAS MÁS ÚTIL DE CARA AL FUTURO?