sábado, 21 de marzo de 2009

El estudio del lenguaje

En un sentido amplio, el lenguaje es la facultad de casi todos los seres vivos para establecer una comunicación mediante la combinación de signos susceptibles de transmitir cualquier tipo de información.


En un sentido estricto, el lenguaje es la capacidad que tiene el hombre de comunicarse mediante sonidos articuladoso y signos escritos, en una suerte de estructura común a todos los idiomas y por tanto una característica universal de la humanidad.


Es por esto que comunicación y lenguaje son términos muy próximos y en algunas ocasiones son usados de manera indiferente, aunque siendo correctos la comunicación es un fenómeno más amplio y que va más allá del lenguaje verbal, no siendo algo exclusivo del ser humano.


El estudio del lenguaje se puede llevar a cabo desde diferentes ópticas, todas ellas desde el punto de vista antropológico y en algunos casos etnográfico:


  • Histórica: Estudio del origen del lenguaje, las formas antiguas de una lengua, el cambio y evolución del lenguaje...

  • Social: Cómo se utiliza el lenguaje con el fin de comunicar, de influir sobre las opiniones, de persuadir a otras personas; cómo se diversifica atendiendo a factores tales como el sexo de los hablantes, las clases sociales, las variaciones geográficas o los diversos contextos sociales en los que se emplee...

  • Psicológica: Adquisición del lenguaje por parte de los niños, aprendizaje de una segunda lengua por adultos, el lenguaje en personas con deficiencias o enfermedades mentales, el uso creativo del lenguaje...

  • Geográfica/política: Expansión y desaparición de una lengua, bilingüismo, los dialectos y su tratamiento sociopolítico, las lenguas nacionales, la estandarización y normalización de la terminología técnica...

  • Lingüística: Estudia la propia naturaleza del lenguaje, es decir, el sistema que subyace a las diversas lenguas.


La lingüística va más allá de la observación y la descripción de los actos del habla, intenta explicar los juicios, intuiciones e introspecciones de los hablantes. El estudio aislado de los sistemas de lenguas ha pretendido obtener representaciones abstractas, generales, representativas de toda la comunidad de hablantes, pese a la heterogeneidad de la misma. Se parte de un supuesto en el que los hablantes no recurren constantemente a la memoria de todas las expresiones observadas con anterioridad sino que tienen un conjunto de fórmulas y reglas abstractas que les permiten formular y comprender expresiones que nunca han oído antes.


Así pues se habla de competencia de los hablantes en relación a todo este conocimiento tácito e inconsciente del sistema de reglas y principios, este conjunto finito de mecanismos que permiten al ser humano producir y comprender infinitos mensajes que no han sido aprendidos previamente.


Por otro lado se habla de actuación en referencia al uso y la comprensión del lenguaje en situaciones concretas, los enunciados orales directamente observables y los textos escritos, así como toda vacilación, lapsus linguae, o pronunciación incorrecta.


Aunque la actuación se apoya y tiene su razón última de ser en la competencia de los hablantes, la primera es reflejo directo de la segunda únicamente en circunstancias ideales. Por ello, la comunicación concreta queda determinada no sólo por el conjunto de reglas y principios, la gramática, interiorizados, sino por factores externos como las limitaciones de la memoria, estados de nerviosismo, embriaguez, prejuicios, imposiciones sociales...


En 1957 fue introducido el concepto de gramática generativa transformacional por Noam Chomsky, así como los conceptos anteriores de competencia y actuación, poniendo con ello la lingüística estructural a revisión.


Los avances en la computación de la época (test de Turing 1950), las teorías lingüísticas de Chomsky (Estructuras sintácticas 1957), la neurona artificial de McCulloch-Pitts (1943)..., hicieron del Procesamiento del Lenguaje Natural (PLN) (y por ende de la lingüística computacional) una piedra angular de la Inteligencia Artificial (término acuñado por primera vez por John McCarthy en 1956 en la Conferencia de Darmouth), haciendo que la comunidad científica (y las fuentes de financiación) se interesaran en esta rama de investigación y surgieran multitud de líneas de aplicación como las de traducción automática (TA) en su década del optimismo 1954-1966.


Pero como en la IA y la TA, tras unos comienzos muy prometedores del PLN, pronto se frenaron las perspectivas por los múltiples obstáculos semánticos y lingüísticos. Sin embargo, aún en la actualidad son de gran utilidad los estudios efectuados por los grandes investigadores de la época, tales como la taxonomía de gramáticas de Chomsky, utilizada ampliamente en analizadores/correctores morfosintácticos, compiladores, conversores de lenguajes, TA y PLN.


Para ampliar en la materia es interesante revisar la siguiente bibliografía:


  • 50 Years Of Artificial Intelligence
    Springer-Verlag GmbH

  • Advances In Natural Language Processing
    Springer-Verlag GmbH

  • An Introduction to machine translation
    Jonh Hutchins & Harold L. Sommers

  • Challenges in natural language processiong
    Cambridge University Press

  • Connectionist Natural Language Processing
    Sheila Dempsey

  • Curso de lingüística general
    Ferdinand de Saussure

  • El lenguaje y los problemas del conocimiento
    Noam Chomsky

  • History of machine translation
    Jaime Carbonel

  • Machine translation: past, present, future
    Jonh Hutchins

  • Syntactic Structures
    Noam Chomsky

  • The Minimalist Program
    Noam Chomsky

9 comentarios:

  1. bueno hermanito, ya se lo mucho que te gusta la lingüística y en especial Chomsky. Mírate algo de pragmática :) ya me pides apuntes y te los dejo, que también tengo publicaciones de otros lingüistas. La traducción hecha por ordenadores es muy muy chunga, pues las máquinas no llegan a comprender la intención del hablante/escritor, por lo que no la transmiten y se provoca el "lost in translation" jejeje. Los lingüistas, si los estudiamos independientemente de otros....... ups, como que falta algo. Nosotros estamos estudiando ahora a Austin y su "performative Hyphotheis". Bueno, que sólo quería estrenar tu artículo, para que no vengas diciendo que nunca leo tu blog (en verdad nunca lo leo) pero que no me dejes sin trabajo leñe, para traducir ya estoy yo! Estudia más inglés y menos Lingüística :) besos

    ResponderEliminar
  2. Bueno bueno no me lo puedo creer, la que se lee libros a pares y no me lee nunca por fin me ha leido :-)

    Señorita, la traducción automática, y la lingüística computacional en general, es "chunga" y por eso despierta tanto mi interés.

    Como bien dices "...las máquinas no llegan a comprender la intención del hablante/escritor..." y ese es uno de los mayores retos de la IA; tú estabas en la presentación de mi tesis y viste por lo que gustó tanto, precisamente porque usaba esa intención del autor para clasificar las páginas, y por eso conseguía, pese a su sencillez técnica, tan buenos resultados. O igual no te enteraste de qué iba el tema, que también puede ser jejeje.

    Por todo ello es por lo que me gusta la lingüística, la antropología y la psicología cognitiva, porque es el "toque" que le falta a la investigación (o le faltaba, ahora parece que vuelve a ir en esa línea con el sentiment analysis, la hibridación de métodos...) para acercar la IA a la IH, o al menos conseguir buenos resultados en algunas de sus líneas básicas como el aprendizaje, la clasificación, el procesamiento del lenguaje natural...

    Pero tranquila, de momento el trabajo de traductora no te lo va a quitar una máquina, pero como muchas veces te he querido explicar hermanita mía, sí que te lo podría facilitar bastante... ¡¡PERO NO ME ESCUCHAS!! (mi hermana y las máquinas...) :-)))

    Kisses, I'm going to study English... no, I'm going to bed to...zzzz

    ResponderEliminar
  3. Si te gusta el tema de la comunicación, estaría bien que leyeras a Moreno, te daré el nombre completo...Este señor escribió y mucho acerca de como se produce la comunicación y estableció reglas para la comunicación humana. Dice por ejemplo que es imposible no comunicar, puesto que no decir nada da a entender cosas. ESto no es así con respecto a las "máquinas" la ausencia de información no nos lleva a un mensaje concreto sino tal vez a un fallo del proceso...Como siempre Kiko, muuuy interesante tu artículo.

    ResponderEliminar
  4. Algo he leido de esto que comentas estudiando teoría de la información y la comunicación y teoría de sistemas, y gran razón tiene, pero incluso en las máquinas sucede esto, dónde una ausencia de mensajes puede aportar más información que la existencia de los mismos (recuerda que según la teoría matemática de la información ésta es mayor cuanta mayor innovación produce en el receptor, resumiendo un poco), pero es cierto pues que pueda no darse en estos casos comunicación si el receptor no sabe interpretar esta información.

    Pero aquí entramos en una reflexión más filosófica, ¿hay información en una transmisión si no existe comunicación porque algún componente del sistema (emisor, receptor, canal...) no está en sintonía?, vamos, ¿suena el árbol que cae en medio del bosque dónde nadie escucha? jejeje

    Un día escribiré un artículo diferenciando entre mensaje, información y comunicación, que solemos tratar indistintamente, sobre todo las dos últimas, y como tú bien sabes no son lo mismo.

    Me alegra que te guste, en este tema podemos compartir visiones muy complementarias, ya te pediré bibliografía.

    ResponderEliminar
  5. ¡Hola! Os sugiero la visita al blog www.elultramarinos.blogspot.com que trata sobre estas cuestiones.

    Un saludo cordial.

    ResponderEliminar
  6. Este comentario ha sido eliminado por el autor.

    ResponderEliminar
  7. me encanto tu definición, saludos.

    ResponderEliminar
  8. Pueden escribir bien, que lo tienen todo atravesado

    ResponderEliminar