sábado, 1 de mayo de 2010

Procesamiento del Lenguaje Natural en la Empresa: Visionando los Próximos 10 Años


Web 1.0, Web 1.5, Web 2.0, Web 3.0, Web Semántica, Web Social... terminología que muestra que la evolución de la tecnología (principalmente la tecnología Web) ha sido vertiginosa en los últimos años, lo que ha provocado la aparición de nuevas necesidades y por lo tanto de nuevos modelos de negocio.


El Procesamiento del Lenguaje Natural engloba el conjunto de tecnologías necesarias para el entendimiento por parte de las computadoras del lenguaje humano.


¿Y para qué es necesario el PLN en la empresa? He aquí algunos ejemplos:


  • Análisis de Opinión en Blogs: Como una evolución de los métodos clásicos de investigación de mercado, el PLN puede aportar soluciones interesantes para conocer de manera automática qué están opinando los usuarios de nuestros servicios y productos, de los de nuestros competidores o analizar las tendencias del mercado y las nuevas necesidades que surgen.

  • Detección de Plagio: Plagiar, hablando de documentación textual, significa incluir en un documento fragmentos de texto escritos por alguna otra persona sin darle el crédito adecuado. Esta falta ha mostrado en los últimos años una explosión en el número de casos. La razón es sencilla: hoy en día tenemos acceso a un enorme repositorio de información entre páginas especializadas, bibliotecas digitales y enciclopedias digitales como Wikipedia. Pero esta variedad de fuentes hace excesivamente compleja la detección sin ayuda de procesos automáticos como los que se pueden obtener utilizando técnicas de PLN.

  • Sistemas de Recomendación: Todos conocemos las recomendaciones que nos hacen las librerías online sobre libros que otros autores también compraron, pero esto se basa exclusivamente en el aprendizaje automático de las preferencias de compra de un único producto (o incluso una cesta), lo que se corresponde con el aprendizaje de nuestro perfil basado en una única dimensión, la compra. ¿Pero qué sucede con las Redes Sociales? Las Redes Sociales incorporan tal cantidad de información acerca de nosotros que se podría crear un perfil tan ajustado como para recomendarnos cualquier cosa que pudiera ser de nuestro interés y no sólo en una dimesión sino en todas aquellas que conforman nuestro perfil. El PLN es necesario aquí para extraer, a diferencia de la compra que está totalmetne identificada, los datos más significativos de nuestro usuario para la construcción de su perfil y su posterior aprendizaje y comparación para la recomendación.

  • Etiquetado semántico (Generación de Web Semántica): La Web 3.0 ó Web Semántica, como evolución imparable de la gran cantidad de contenidos generados por los usuarios de la Web 2.0 y la Web Social, es la gran protagonista de la mayoría de conversaciones actuales en el mundo académico, profesional e incluso personal (pe. hobbies como las redes sociales de videojugadores), pero existe un grave problema para generar Web Semántica y es que aunque las herramientas existen, el etiquetado de contenidos no deja de ser un trabajo manual laborioso, tedioso, no exento de dificultades como la necesidad de ponerse de acuerdo en las etiquetas utilizadas y en el emparejamiento de los contenidos con una o más de estas etiquetas. Con las técnicas de Procesamiento de Lenguaje Natural se puede hacer una aproximación automática a este etiquetado de contenidos para generar así conocimiento útil y aplicable.

  • Búsqueda Documental (Búsqueda Semántica): Otra de las grandes protagonistas es la búsqueda documental, debido principalmente a que el uso intensivo de las tecnologías en el ámbito profesional (y también en el personal) deriva en la generación de grandes cantidades de información documental de difícil explotación y recuperación. Las técnicas de PLN permiten organizar y acceder, de manera similar al punto anterior, a toda esa documentación obviando ciertos problemas de la lengua como los errores ortográficos, las acronimias o la sinonimia, permitiendo una recuperación de información adecuada por ejemplo a consultas como "ayudas ayto. Jijón" devolviendo resultados para ayudas, subvenciones, becas y financiación relativas al ayuntamiento de Gijón.

  • Georeferenciación automática de contenidos:: Los GIS son una de las tecnologías de mayor auge en los últimos tiempos y ello debido a la importancia creciente que se le da a la localización sobre el territorio de prácticamente cualquier cosa. Como os expusimos en el trabajo GIRPharma, las técnicas de PLN permiten de manera automática georeferenciar contenidos textuales existentes en diversas fuentes, en el ejemplo, farmacias de guardia a partir de las diversas páginas Web que publican esta información. Pero yendo más allá y tomando como ejemplo el proyecto ArchaeoloGIS, podríamos georeferenciar en él todos aquellos contenidos existentes en la Web referentes a la ciudad de Valencia en las diferentes épocas históricas, ayudando de este modo a la inclusión de una información que de manera manual sería muy costosa.

Estos y muchos más serán los temas que podremos ver en el próximo WorkShop Procesamiento del Lenguaje Natural en Empresas: Visionando los Próximos 10 años que tendrá lugar en el marco de la SEPLN 2010 que este año se celebrará en Valencia los días 6 y 7 de septiembre.


¡¡¡Os esperamos a todos, INVESTIGADORES, EMPRESARIOS Y CURIOSOS EN GENERAL!!!

jueves, 15 de abril de 2010

Investigación en GIS


El departamento de investigación de Corex está de enhorabuena pues le han sido aceptados dos artículos en la "1st International Conference on Computing for Geospatial Research & Application" que tendrá lugar el próximo Junio en Washington DC

Los títulos de los trabajos son:


  • "ArchaeoloGIS: Using Geographic Information Systems to Support Archaeological Research", realizado conjuntamente con el investigador José Ferrandis de Forum Unesco-UPV

  • "GIRPharma: A Geographic Information Retrieval Approach to Locate Pharmacies on Duty", llevado a cabo conjuntamente con los investigadores Davide Buscaldi y Paolo Rosso del Laboratorio de Ingeniería Lingüística del DSIC-UPV

Próximamente serán publicados por ACM Digital Library.

¡Enhorabuena!

lunes, 12 de abril de 2010

NACE TIC SYNERGIES


El pasado 8 de Abril de 2010 en la ciudad de Valencia, nace un nuevo consorcio de exporatción de nuevas tecnologias de Valencia para el mundo cuyo nombre comercial es:

TIC SYNERGIES, " www.ticsynergies.com " y lo componen la siguientes empresas especialistas en TIC y empresas con sinergias en este sector, son:





- COREX SOLUCIONES INFORMATICAS " www.corex.es "
- SAI WIRELESS " www.saiwireless.com "
- UVAX CONCEPTS " www.uvax-concepts.com "
- PIXEL STUDIOS " www.pixelstudios.es "
- FACTORY WEB " www.factoryweb.es "
- EQUIPO HUMANO " www.equipohumano.net "

Y con la experiencia en este tipo de consorcios como es, Carnicer y Perete, www.carniceryperete.com, hemos emprendido una nueva aventura en el ambito internacional apostando por mercados como China, la UE, EEUU y americana latiana etc. y contando con empresas con experiencia en el exterior como SAI y UVAX.

Juntandonos estos perfiles de empresas abarcanmos practicamente todas las tecnologias en el sector TIC, incorporando las nuevas tendencias como son semantica, lenguaje natural, investigación social media, teleasistencia, diseño de infraesctruturas sofisticas, hosting, servidores, equipos de control y eletronica, sistemas GIS, tecnologia en recursos humanos etc todo ello detallado en nuestra proxima pagina web la cual estamos contruyendo.

Un abrazo a todos.

viernes, 9 de abril de 2010

XML en Windows Mobile

Uno de los últimos proyectos en los que estoy trabajando consiste en un sincronizador SERVER <-> PDA basado en servicios Web.

Uno de los requisitos es que toda la información con la que trabaje la PDA sean XML de estructura conocida, pues las aplicaciones que pueden haber detrás son múltiples.

Lo anterior es un poco de background del proyecto que no precisa mayor explicación. El objetivo del post es mostrar los resultados de los experimentos efectuados en una Toshiba G810 con Windows Mobile 6.1 en lo que se refiere al tratamiento masivo de XML con una aplicación Microsoft .Net Mobile 3.5 en C#


Los experimentos consisten en parsear un dataset de 5000 registros con un XML cada registro, y este XML con 5 elementos de segundo nivel, esto es, algo como:

<elements><element name="nnn" value="vvv" />...<element name="nnn" value="vvv" /></elements>

Con el resultado, construir un DataSet cuyas cabeceras tengan los nombres de los elementos (atributo name), y cuyas filas los valores contenidos en ellos (atributo value), para poder enlazarlo a un control grid.


Las opciones para parsear son varias, y también los resultados obtenidos:

  • XMLDocument + SelectNodes:

    El primer experimento consiste en utilizar DOM para acceder a los XML individuales. Para cada XML se construye su XMLDocument, se efectúa un SelectNodes y se extrae la información de sus atributos name y value

    Tiempo 1:58min

  • IndexOf + SubString:

    El segundo experimento consiste en utilizar las funciones de tratamiento de cadenas (IndexOf y SubString) para obtener el contenido de name y value de cada nodo

    Tiempo 0:41min

  • XmlDocument + IEnumerator:

    El tercer experimento consiste en utilizar DOM para construir el documento a partir de cada XML, pero en lugar de buscar sus nodos con selectnodes, se recorren sus atributos con su enumerator, comprobando qué atributo estamos leyendo, name o value

    Tiempo 1:49min

  • XMLDocument:

    Tras lo anterior se decide comprobar únicamente la creación del documento DOM y se observa que lleva prácticamente la mitad del tiempo del proceso total

    Tiempo 0:40min

  • RegularExpressions:

    Comprobando el buen resultado de las funciones de cadena frente a las de tratamiento de XML se prueba con una expresión regular que obtiene los valores de los atributos name y value para cada elemento de cada XML.

    Tiempo 1:45min

  • String:

    Puesto que lo que mayor tiempo consume es la construcción del DOM, así como el acceso usando métodos de tratamiento textual es bastante inferior en coste temporal, se prueba a leer y acumular en una variable String cada XML individual para construir un XML global, con el que poder experimentar tanto con DOM como con las funciones de cadena.

    Tiempo 5:41

  • StringBuilder:

    Añadir dinámicamente a una variable tipo String requiere reasignaciones de memoria consecutivas, con lo que se prueba con la clase StringBuilder para al final hacer una conversión a String y poder efectuar experimentos con DOM y con funciones de cadena.

    Resultado OOM Exception


Conclusiones

Las principales conclusiones que se pueden extraer son las siguientes:

  • El tratamiento de XML en un dispositivo móvil, en cualquier caso, es lento

  • No es buena idea realizar un uso intensivo de la memoria (reasignaciones, clases complejas...) porque elevan el tiempo de proceso y provocan fácilmente excepciones del tipo Out Of Memory

  • Los métodos de tratamiento de XML por DOM son lentos frente a búsquedas más rudimentarias con funciones de cadena

  • El tratamiento de las expresiones regulares es lento, por lo que su uso no está justificado siempre que se pueda efectuar el mismo trabajo con funciones de cadena


NOTA: ESTO NO ES UN ESTUDIO RIGUROSO, NO SE HA REPLICADO RESULTADOS, NO SE HAN VAIRADO PARÁMETROS... POR LO QUE, NO TIENE NINGUNA VALIDEZ CIENTÍFICA NI ESTADÍSTICA, PERO DA IDEA DE UNA APROXIMACIÓN A LOS PROBLEMAS QUE SURGEN CUANDO SE DEBE TRATAR GRANDES CANTIDADES DE DATOS XML EN UN DISPOSITIVO MÓVIL Y QUE LA SOLUCIÓN QUIZÁS MENOS ELEGANTE Y MÁS RUDIMENTARIA, ES LA MÁS EFECTIVA

jueves, 1 de abril de 2010

Accesibilidad y Usabilidad en la Web

1. Introducción

La Web evoluciona, y evoluciona porque así lo hacen las necesidades humanas en su infinita necesidad de aprender, crecer y autorealizarse, y una de las mayores evoluciones que ha seguido a esta ( r )evolución de la Web, de una manera tan entrelazada que no se sabe si es consecuencia o motivo, pero en cualquier caso que no podría haber sido sin ella, es la del modo en que se ha ido centrando el interés en el usuario final, y ya no sólo en el contenido y modo de interacción, como veíamos en el artículo de redes sociales, sino en la forma, en el diseño, en el modo de uso, en el concepto de globalización en el sentido más amplio de apertura e integración de culturas y grupos sociales, a la par que su focalización en el individuo individual y la personalización de sus necesidades.

Aquí estamos hablando del concepto de usabilidad en la Web, el cómo el usuario percibe el uso de la misma, y del concepto de accesibilidad, esto es, el cómo la Web permite el acceso a diferentes grupos sociales sin discriminación ni barreras por su condición.

2. Usabilidad en la Web

2.1 Introducción

En [1] se define la usabilidad como “el nivel con el que un producto se adapta a las necesidades del usuario y puede ser utilizado por los mismos para lograr unas metas específicas con efectividad, eficiencia y satisfacción en un contexto específico de uso”.

Según la definición anterior podemos inferir que es el usuario del producto quién determina la usabilidad del mismo, porque le permite alcanzar de manera sencilla y satisfactoria, en términos de efectividad y eficiencia, los objetivos concretos para los que fue diseñado.

Por tanto, el principal hito de la usabilidad es que el diseño debe estar centrado en el usuario, mediante un conocimiento amplio de su contexto de uso, y con el objetivo de satisfacer sus necesidades.

En el desarrollo de la Web, de igual modo que en otros sectores productivos, la usabilidad se ha ido tomando cada vez más en consideración, evolucionando desde un diseño centrado y basado en el creador del sitio y sus propias preferencias y objetivos, hacia un diseño centrado en el usuario final, sus preferencias, necesidades y objetivos.

Respecto al software en general, se viene observando desde hace mucho tiempo que el usuario no muestra un interés especial en la estructura interna de una aplicación, ni incluso en su funcionalidad, sino más bien en cómo usarla y en la interfaz que publica para ello, llegando al extremo de que muchos sistemas no son usados por un mal diseño de ésta última.

Cuando el software en general se particulariza al caso de la Web, dónde la casuística e idiosincrasia de los usuarios es global, un correcto diseño de la interfaz que atienda a las pautas de usabilidad universal no garantizará el éxito de la misma, pero el no hacerlo sí que garantizará su fracaso.

Un ejemplo anecdótico, por extremo y por real, es el siguiente extraído de una entrevista [2] a Noel Franus, fundador de Carbon IQ:

“Un ejemplo muy caro: hace un año Apple rediseñó su sitio. Era un diseño sexy y llamativo que te invitaba a comprar. Pero no había forma de hacerlo, porque no existía el botón Compra en la pantalla. Lo solucionaron. Lo divertido fue que para realizar la Web contrataron a una de las mejores compañías del mundo de diseño Web. Pagaron millones de dólares. Pero algo tan sencillo como la ausencia de un botón puede hacerte perder muchos millones.”

Por cosas como la anterior es muy importante tener presente en el diseño de una interfaz a quién va dirigido y los requisitos mínimos que debe cumplir.

2.2 Requisitos y medidas de usabilidad

Los requisitos de usabilidad son múltiples pero todos centrados en su objetivo principal, que es hacer que el usuario perciba la interfaz centrada en sus necesidades y que le permitan resolver sus objetivos de manera eficaz y eficiente.

Para determinar este nivel de usabilidad se suelen utilizar medidas como las siguientes, extraídas de [3]:

· El tiempo que necesitan los usuarios para aprender a realizar sus tareas

· La velocidad para realizar las tareas

· La cantidad de errores que se cometen en la realización de las tareas

· La retención del modo de operación con el paso del tiempo

· Y principalmente, debido a que la usabilidad persigue la satisfacción del usuario, será la satisfacción subjetiva que éste perciba la principal medida de usabilidad del sistema

Cualquier diseñador de interfaces debe tener presente que el objetivo es conseguir un compromiso entre todas estas medidas y que no siempre se pueden conseguir de manera conjunta pues dependen en gran medida de la dificultad intrínseca de la tarea y del perfil del usuario que la lleva a cabo.

2.3 Usabilidad universal

La Web, por su carácter global, debe dar respuesta a una gran variedad y diversidad cultural, social, cognitiva, psicológica y en general de capacidades humanas que son todo un reto para el diseño de su interfaz y que hay que tener en cuenta si se quiere tener un mínimo de aceptación y uso por parte de un público cada vez más concienciado y exigente.

Algunas de las diversidades a tener en cuenta son:

· Las capacidades cognitivas y perceptivas referentes a la memoria a corto y largo plazo, la comprensión del lenguaje, la capacidad de aprendizaje y asimilación de conceptos, la resolución de problemas, etcétera

· Las referentes a la personalidad, dónde personas extrovertidas frente a introvertidas, sensoriales frente a intuitivas, perceptivas y sentimentales frente a juiciosas y racionales, adoptarán posturas diferentes ante una misma interfaz, lo que puede generar aprecio o rechazo frente a la misma

· Las culturales, tanto desde el punto de vista étnico y/o lingüístico, como de nivel cultural dentro de un mismo grupo, lo que afectará en la interpretación de formatos, medidas, títulos sociales, signos de puntuación, protocolos y formalidades, entre otros

· Las discapacidades, que serán vistas en el apartado de accesibilidad y que son una particularidad especial a tratar dentro de la usabilidad.

· Las referentes a la edad, personas mayores y niños, los colectivos discriminados y un largo etcétera de diversidades que en gran medida están contempladas también en temas de accesibilidad

· Tecnológica, como conexión a Internet, tamaños de pantalla, requisitos de memoria y proceso, etcétera

Es interesante nombrar al Center of Universal Design [4], resumido en [5], que trabaja en las líneas de definición de estándares de diseño y construcción universales.

2.4 Principios de diseño de interfaces

Existen multitud de autores [6][7][8] y organizaciones [9] que proponen principios generales de diseño. Una agrupación y resumen bastante interesante es el propuesto por [3] en sus “ocho reglas de oro del diseño de interfaces”, y resumido en [10]:

· Consistencia: En situaciones parecidas deberían exigirse secuencias de acciones parecidas

· Usabilidad universal: Se debería reconocer la diversidad de usuarios y permitir la transformación del contenido para adaptarse a estos, por ejemplo, por diferencias principiante-experto, rangos de edad, discapacidades, diversidad tecnológica

· Realimentación informativa: Cada acción del usuario debe tener una realimentación del sistema, proporcional en la medida de la importancia de las primeras, por ejemplo, acciones comunes deberían realimentar de manera que no entorpezca el trabajo del usuario pero que el mismo esté seguro de la realización de su acción, y acciones poco comunes deben alertar de la situación y las consecuencias de manera precisa

· Guiar hacia la consecución de la tarea: Las tareas se deben organizar como secuencia de acciones con principio y fin, y la interfaz debe guiar, mediante diálogos y mensajes de realimentación, desde el principio al final de la tarea

· Prevención de errores: Evitar en lo posible que el usuario pueda cometer errores, por ejemplo, restringiendo los tipos y tamaños de entrada, o deshabilitando elementos no adecuados para el estado de tarea actual, y permitiendo la recuperación a partir de errores que el sistema debería ser capaz de detectar

· Deshacer acciones: Las acciones realizadas por el usuario deberían poder deshacerse sin demasiada complejidad, de manera que se estimule la exploración de nuevas funcionalidades sin ansiedad o miedo, apoyado en la seguridad de poder deshacer cualquier acción

· Dar soporte al locus de control interno: El usuario debe tener la sensación de mandar sobre la interfaz y no al revés, para lo que la interfaz debe responder de manera determinista a las acciones de este

· Reducción de la carga de memoria a corto plazo: Según la “regla siete más/menos dos” el ser humano tiene una memoria a corto plazo muy limitada y esto se debe tener en cuenta en el diseño de interfaces de manera que el usuario sepa en todo momento dónde está, cómo ha llegado y hacia dónde va, sin necesidad de tener que recordarlo, así mismo como se debe proporcionar ayuda en línea y ayuda contextual para que no tenga que recordar el modo de realización de acciones complejas que no estén claras de manera visual

Es interesante nombrar “Las diez plagas de la era de la información” según Shneiderman [3] y que se resumen en [11], pues muestran un resumen claro y conciso de los riesgos que provoca el uso de las TIC, especialmente cuando su diseño no se centra en el usuario.

1 3. Accesibilidad en la Web

3.1 Introducción

Según el [12] “algo es accesible cuando puede ser obtenido fácilmente”, lo que en la Web se puede traducir a que una determinada información es accesible cuando todo el mundo puede encontrarla y usarla, o de manera más específica, [13] una Web es accesible cuando cualquier persona, independientemente de sus capacidades personales o tecnológicas, puede acceder a ella desde Internet y puede utilizar y comprender todos sus contenidos.

Un mapa conceptual de lo que envuelve a la accesibilidad y la usabilidad, desde el punto de vista conceptual, y de sus normativas y herramientas es el mostrado en la siguiente imagen, extraída de [14]:





La accesibilidad es por tanto un término, a diferencia de la usabilidad que es más general, restringido a usuarios que presentan una discapacidad y que ésta reduce su capacidad de acceso a la información.

3.2 Tipos de discapacidades

Según la Clasificación Internacional de Deficiencias, Discapacidades y Minusvalías (CIDDM) se considera discapacidad a toda restricción, deficiencia o ausencia de capacidades para la realización de ciertas tareas en la forma o margen considerado normal (dentro de la norma) para un ser humano.

Algunos tipos de discapacidades son los siguientes:

· Visuales: Personas con problemas graves de visión, como visión parcial, visión cromática parcial ó ceguera total.

· Auditivas: Personas con problemas graves de audición, como discapacidad leve auditiva, sordera total, sordo-ciegas ó sordo-mudas

· Motoras: Personas con problemas motores graves, como problemas de coordinación, movilidad reducida, o problemas de movilidad con extremidades, por ejemplo, y en el caso de la Web, movilidad de los miembros superiores

· Cognitivas: Personas con problemas cognitivos o neurológicos que les generan dificultades de comprensión, incluyendo aquí tanto deficiencias mentales y lesiones neurológicas, como bajos niveles culturales

· De edad avanzada: Personas que debido a su edad han desarrollado deficiencias visuales, auditivas, motoras o cognitivas

Un mapa de distribución de las discapacidades en Europa es el siguiente, extraído de [14]:



Además de las discapacidades que dificultan el acceso a la información existen diversas barreras arquitectónicas o de diseño que pueden dificultar el mismo y que tienen gran relación con las diversidades tecnológicas relacionadas en la sección 2.3

3.3 Diseño Web accesible

El diseño Web accesible se centra en eliminar todas las barreras de diseño que puedan provocar que personas con discapacidad (o restricciones tecnológicas) no puedan acceder, usar y comprender la información contenida en ella.

Las Pautas de Accesibilidad al Contenido en la Web suponen el esfuerzo más importante realizado a nivel internacional para definir un estándar de diseño accesible en la Web.

El grupo de iniciativa de accesibilidad del W3C (WAI) [15] persigue la accesibilidad de la Web a través de 5 áreas de trabajo principales:

· Tecnología

· Directrices

· Herramientas

· Formación y difusión

· Investigación y desarrollo

Así mismo, para comprobar el nivel de accesibilidad que tiene una Web se pueden utilizar diferentes herramientas que permiten validar la adecuación de la Web a los niveles definidos por la WAI (A, AA, y AAA).

La propia Web del W3C aporta gran cantidad de información referente a estas iniciativas.

4. Conclusiones

El presente artículo repasa someramente los conceptos de usabilidad y accesibilidad en la Web, introduciendo al lector en la problemática, los objetivos y los medios para conseguir que la Web sea un lugar de todos y para todos, porque, a falta de detallar las múltiples ventajas que el diseño usable y accesible nos aportan, lo resumimos con una única frase, “TODO EL MUNDO TIENE DERECHO A DISFRUTAR DE LA WEB”, lo que visto desde un punto de vista altruista es un objetivo primordial por el cuál trabajar en pro de la usabilidad y la accesibilidad, y visto desde un punto de vista egoísta, es una necesidad si queremos que nuestro sitio Web pueda llegar a tener éxito en un mundo cada vez más concienciado y exigente con los derechos fundamentales de todo individuo.

Referencia

[1] ISO 9241‐11‐Guidance on usability 1988

[2] Pantaleoni, A. La ausencia de un botón te puede hacer perder muchos millones. Ciberpaís, 1 (18), 8. 2002

[3] Shneiderman, B., Plaisant, C. Diseño de Interfaces de Usuario. Estrategias Para una Inter-acción Persona-Computadora Efectiva. ISBN: 84-205-4803-0

[4] Center of Universal Design

http://www.design.ncsu.edu/cud/index.htm

[5] Rangel, FM., Center of Universal Design Blog Grupo Fivasa, 2008

http://grupofivasa.blogspot.com/2008/12/center-of-universal-design-aspectos.html

[6] Mandel, T. The Elements of User Interface Design. John Wiley & Sons, Inc. Nueva York, 1997

[7] Preece, J. Human Computer Interaction. Addisson Wesley. Nueva York, 1994

[8] Simpson, H. Design of User Friendly Programs for Small Computers. McGraw Hill. Nueva York, 1985

[9] IBM Corporation. IBM User Interface Architecture, 1est. Edition. 2001

[10] Rangel, FM., Diseño de Interfaces. Blog Grupo Fivasa, 2009

http://grupofivasa.blogspot.com/2009/09/diseno-de-interfaces.html

[11] Rangel, FM., Diez Plagas de la Era de la Información. Blog Grupo Fivasa, 2009

http://grupofivasa.blogspot.com/2009/05/diez-plagas-de-la-era-de-la-informacion.html

[12] Picket, J. The American Heritage Dictionary of the English Language. Houghton Mifflin Company. Boston, 2000

http://www.bartleby.com/61

[13] Yonaitis, R. Comprendiendo la Accesibilidad. Una Guía para Lograr la Conformidad en Sitios Web e Intranets. HiSoftware, Concorde. New Hamsphire USA, 2002

http://www.hisoftware.com/uaes/uaccess-es2.htm

[14] Rodrigo, C. Usabilidad y Accesibilidad de los Sitios Web: Diseño y Arquitectura. Depar-tamento de Lenguajes y Sistemas Informáticos. UNED, 2007

[15] W3C (WAI) http://www.w3.org/WAI

sábado, 20 de marzo de 2010

Redes Sociales: Desde la perspectiva de un investigador

Introducción

Robin Dunbar [12][13], de la Universida de Liverpool, dijo a mediados de los noventa que “El lenguaje no fue originariamente ni más ni menos que el despiojarse verbal”, y así sigue siendo en nuestros días dónde, siguiendo la famosa pirámide de Maslow [10], los seres humanos pasamos de cubrir nuestras necesidades fisiológicas básicas y de seguridad, a relacionarnos para sentirnos pertenecientes y aceptados, reconocidos y autorealizados en la sociedad a la que pertenecemos.

De esta necesidad humana de pasar de una etapa inferior de la pirámide a una superior surge la necesidad de los individios de agruparse y relacionarse entre ellos, creando lo que se conocen como redes sociales.

Una red es una manera abstracta de visualizar y modelizar un sistema [1], y de igual modo una red social es una manera, formal o no, de modelizar el comportamiento relacional del ser humano en sociedad.

Las redes sociales en internet son la evolución telemática de las redes sociales formadas por el conjunto de individuos de una sociedad, y que permiten ampliar las fronteras físicas y temporales de su realidad.

La modelización de las redes sociales se suele basar en la teoría de grafos para su representación y estudio, dónde los elementos de la red se identifican con elementos del grafo, y así pues, generalmente, se asocian los actores (o individuos) de la red con los nodos de la misma, y las relaciones entre ellos como sus arcos.

Pero una red social en internet incorpora algunos elementos extra que están implícita o explícitamente contenidos en el modelo, y estos son el conjunto de contenidos asociados al individuo (vídeos, fotografías, textos, documentos, presentaciones…), el tipo de relaciones que mantiene con sus semejantes (conoce, pertenece, recomienda, lee…) y la estructura misma de la red [16].

Una red social, a diferencia de otras redes artificiales creadas y modeladas por el ser humano y que presentan por lo general apariencia aleatoria, se comporta como una red compleja, lo que permite estudiarla teniendo en cuenta un conjunto de leyes que se cumplen en este tipo de redes: concentración de nodos, autosemejanza [17], leyes de potencia [1][19], elementos periféricos, Authority vs. Hub [21], teoría de los 6 grados de separación [20], teoría de los 10 saltos [21], y un largo etcétera, y que permiten extraer conocimiento interesante sobre el modo de relacionarse de sus individuos a partir de su estructura.

La apariencia de una red social de intener real visualizada como un grafo sería la mostrada en la siguiente figura:


Evolución

Como en todo, los orígenes de las redes sociales no están claros y menos cuando su propia definición no lo está, ya que hay autores que consideran que son redes sociales solo aquellas basadas en perfiles (tuenti, facebook…) y otros que consideran todas aquellas que plasman de algún modo las relaciones sociales de los individuos que hay detrás (blogs, twitter, youtube, …).

Ya en los comienzos de la Web, al menos en los comienzos de la popularización de la misma, ciertos internautas y creadores de sitios Web con una visión adelantada a su tiempo crearon pequeñas aplicaciones que permitían que los usuarios actualizaran contenidos de manera dinámica, que otros usuarios pudieran dejar sus propios comentarios o que ciertos grupos pudieran tener acceso a contenidos no públicos, construyéndose así lo que ahora, al menos desde que Tim O’Reilly acuñara en 2004 el término Web 2.0, venimos a denominar la Web 1.5 [3].

Pero las redes sociales como se las conoce por la mayoría de autores comienza su aparición con aplicaciones como classmates.com en 1995 para recuperar contacto con antiguos compañeros, AsianAvenue, BlackPlanet y Migente de 1997 a 2001, friendster, myspace en 2003, google orkut en 2004, yahoo 360º en 2005, nacen los blogs como tal en 2004 (aunque existían páginas considerables como blogs desde los comienzos de internet), nano y microblogs como twitter…

Actualmente el panorama de las redes sociales está dominado por Hi5, MySpace, Facebook, Tuenty y Twitter.

Tecnologías

Las redes sociales aparecen ligadas a una evolución [3][15][18][20], más que de las propias tecnologías, que también ya que su desarrollo permite en cierta medida efectuar cosas que anteriormente eran imposibles, en el uso de las mismas, esto es, pasando de un modelo secuencial, lineal, unidireccional de Web 1.0 dónde el creador de una página (o sitio) decide qué contar y cómo contarlo, y el resto de cibernautas puede decidir leerlo o no, y comienza con la construcción de su propia red mediante la inclusión de enlaces a otras páginas, hacia un modelo colaborativo dónde los sitios Web no son construidos únicamente por sus creadores sino con la colaboración del resto de internautas, evolucionando de este modo hacia lo conocido como Web 2.0.

La Web 1.0 ya seguía la estructura de red compleja, tal y como se muestra en estudios como los de [20], dónde unos pocos nodos centrales conectan con gran cantidad de nodos periféricos, quedando islas de páginas que no están conectadas con nadie. La evolución a la Web 2.0 no altera esta estructura, pero sí el modo en que esta red crece, y la palabra mágica que se lleva oyendo desde que surgió el vocablo Web2.0, de manera COLABORATIVA.

Para que esta colaboración se pueda llevar a cabo han surgido una serie de tecnologías (en realidad se han desarrollado a partir de tecnologías ya existentes) como:

· XML, XHTML, microformatos, CSS… que permiten el marcado semántico de la información y su transmisión entre pares no tecnológicamente similares. Otra palabra mágica, INTEROPERABILIDAD

· RSS, ATOM, microformatos… que permiten, mediante formatos adaptados a partir de las tecnologías anteriores, la redifusión y agregación de contenidos

· AJAX y demás tecnologías cliente no intrusivas que enriquecen las aplicaciones Web

· Widgets, gadgets, mashups [22], en definitiva, micro o macro componentes que se pueden combinar para crear aplicaciones híbridas

· WYSIWYG ó What you see is what you get que es como se conoce a las tecnologías que permiten que el editor de un sitio web vea sobre la marcha cómo va a quedar publicada su información.

· … un largo etcétera no restringido a una u otra tecnología (léase Java vs. .Net, ó Microsoft vs. Open Source), sino al modo de empleo de la misma, es decir, a permitir que el usuario sea propietario de su propia información y pueda colaborar con otros usuarios en la construcción de la Web

Investigación

Las redes sociales en internet no sólo resultan interesantes para el público lúdico que desea relacionarse más allá de su interacción real del día a día, sino que por su estructura, y por representar a gran escala el comportamiento social del ser humano, vienen siendo foco de interés por la investigación en múltiples áreas de investigación, siendo las siguientes algunas de ellas:

· Antropológico: Tal como se citaba al comienzo del artículo, las últimas investigaciones antropológicas van en la línea de que el ser humano no comenzó a hablar para compartir información sino para relacionarse con otros seres humanos. Esta necesidad de relación queda latente en el uso de las redes sociales, y su estudio puede determinar modelos de comportamiento de la especie en un ámbito de interrelación global jamás visto hasta la actualidad.

· Psicológico: Según la pirámide de necesidades de Masslow el ser humano está predispuesto a escalar por ella a medida que tiene cubiertas necesidades básicas, pero también siguiendo otras teorías como las de Freud, las redes sociales permitirían observar el comportamiento psicológico cuando no se enfrentan directamente a la relación con otros seres humanos sino a través de una barrera protectora, el ordenador

· Sociológico, político y económico: Por las características de red compleja que presentan, es de interés sociológico el estudio de por qué las sociedades se comportan así, por qué surgen leyes de potencias como la de Pareto y qué repercusión política y social tienen en la sociedad.

· Geográfico: En la actualidad, y como una de las tecnologías estrella en la Web 2.0, está surgiendo de nuevo (de nuevo porque en épocas militares son tecnologías clave) las tecnologías de representación cartográfica y territorial. Las redes sociales dan un salto por encima de fronteras territoriales, pero los comportamientos demuestran que seguimos formando agrupaciones según nuestro ámbito geográfico. La georeferenciación y el estudio sobre el terreno de las relaciones sociales de las redes son una de las líneas de investigación clave en esta materia.

· Tecnológico: Pese a como se cree este no es el único ámbito de interés de estudio en redes sociales, pero sí que es uno muy importante. Las redes sociales aunan contenidos e interacciones entre cantidades de individuos hasta ahora no imaginables, lo que requiere de investigación en nuevos modelos de computación, de almacenaje, de redes de telecomunicaciones, de hardware y en general de una nueva revolución tecnológica.

· Procesamiento del lenguaje natural y aprendizaje automático: Unas de las ramas de la computación inteligente que han seguido evolucionando tras las primeras decepciones de la inteligencia artificial sufridas a finales del siglo pasado, es la del procesamiento del lenguaje natural y el aprendizaje automático. No sin problemas [25], cambios de paradigmas y nuevas decepciones, el PLN está mostrando un interés creciente en las redes sociales de las que se puede alimentar para extraer análisis de opinión [5], líderes de opinión, recomendación de contenidos [4], análisis de sentimientos [7], detección de plagios [26], análisis de ironía… generando conocimiento a partir de la inmensa cantidad de datos de que disponen estas redes, y sirviendo de validación de los modelos lingüísticos y computacionales de tratamiento y aprendizaje del lenguaje humano.

Conclusiones

El ser humano es increiblemente complejo y cualquier cosa que haga nos sirve para conocerlo mejor. Así es como cada vez más investigadores ven a las redes sociales en internet, como una gran fuente de conocimiento sobre nosotros mismos, fuente de conocimiento desde cualquier prisma que lo mires (antropológico, social, psicológico, económico, tecnológico…)

El usuario de la red social sólo percibe que puede llegar donde hasta ahora no podía, es decir, transgredir sus límites no sólo termporales y espaciales, sino personales y sociales, pudiendo contactar y tratar con personas que de otro modo no le sería posible.

Desde el punto de vista del usuario las redes sociales me abren posibilidades hasta ahora no factibles. Desde el punto de vista del investigador, la tarea más compleja de recopilación de información se convierte en la tarea de selección de esa información.

Referencias

[1] Merelo, J.J. Lo que una empresa debe saber de las redes sociales. JICAN09

[2] Merelo, J.J. Redes Sociales para usted y su cuñado.

http://www.maestrosdelweb.com/editorial/redessociales/

[3] Merelo, J.J. Una Web en versiones 1.0, 2.0, 3.0. JICAN09

[4] Bax, I., Moldvay, J. Data-Driven Ontologies for Recommender Engines in Social Networks. 1est. International Workshop on Mining Social Media in the 13th. Conference of Spanish Association for Artificial Intelligence (CAEPIA-TTIA 2009)

[5] Rangel, F.M., Peñas, A. Detecting Blogs Independently from the Language and Content. 1est. International Workshop on Mining Social Media in the 13th. Conference of Spanish Association for Artificial Intelligence (CAEPIA-TTIA 2009)

[6] Ritterman, J., Osborne, M., Klein, E. Using prediction Markets and Twitter to predict a Swine Flu Pandemic. 1est. International Workshop on Mining Social Media (MSM09) in the 13th. Conference of Spanish Association for Artificial Intelligence (CAEPIA-TTIA 2009)

[7] Reyes A., Rosso, P. Linking Humour to Blog Analysis: Affective Traits in Posts. 1est. Workshop on Opinion Mining and Sentiment Analysis (WOMSA09) in the 13th. Conference of Spanish Association for Artificial Intelligence (CAEPIA-TTIA 2009)

[8] Wikipedia, Red Social.

http://es.wikipedia.org/wiki/Red_social

[9] Maestros del Web, Redes Sociales en Internet.

http://www.maestrosdelweb.com/editorial/redessociales/

[10] Musitu, G. Manual de Psicología de la Comunicación. ISBN: 848959614X

[11] Wright, J. BlogMarketing. ISBN: 0072262516

[12] Dögnes, J. Evolución del lenguaje. Mente y Cerebro (Enero 2010)

[13] Falk, D. Prelinguistic Evolution in Early Hominins: Whence Motherese? Bevahioral and Brain Sciences, 2004

[14] Aldana, M. Redes Complejas. http://www.fis.unam.mx/~max/English/notasredes.pdf

[15] Baeza-Yates, R. Evolución de la Web Chilena. JCC2003

[16] Rangel, F.M., GIS y Redes Sociales. Curso de Introducción al GIS de Corex World 2010

[17] Mandelbrot, B., Hudson, R., Fractales y finanzas. ISBN: 8483104857

[18] Baeza-Yates, R. Características de la Web de España. El profesional de la Información, Enero 2006.

[19] Estrin, S., Laidler, D. Microeconomía. ISBN: 0745014666

[20] O’Neill, E., Lavoie, B., Bennet, R. Trends in the Evolution of the Public Web. 1998-2002

http://www.dlib.org/dlib/april03/lavoie/04lavoie.html

[21] Brin, S., Page, L. The PageRank citation ranking: Bringing order to the Web

http://citeseerx.ist.psu.edu/legacymapper?did=368196

[22] Wikipedia. Six degrees of separation.

http://en.wikipedia.org/wiki/Six_degrees_of_separation

[21] Editum.org ¿Qué son las Redes Sociales en Internet?

http://www.editum.org/Que-Son-Las-Redes-Sociales-En-Internet-p-316.html

[22] Wikipedia. Mashup (aplicación web híbrida)

http://es.wikipedia.org/wiki/Mashup_(aplicación_web_híbrida)

[23] Wikipedia. Microformato

http://es.wikipedia.org/wiki/Microformatos

[24] Wikipedia. Ajax

http://es.wikipedia.org/wiki/AJAX

[25] Chomsky, N. El lenguaje y los problemas del conocimiento. Conferencias de Managua 1. ISBN: 8477748527

[26] Barrón, A. Detección automática de plagio en texto, una breve reseña. Blog del Grupo Fivasa (pendiente de publicación en SEPLN)

http://grupofivasa.blogspot.com/2010/01/deteccion-automatica-de-plagio-en-texto.html