NewsML – XML para las noticias

Publicado: 16-12-2008 | Por: Carlos Cordero | Categoría: Internet, Java, Software
Comentarios: Ver Comentarios

No creo que sea un misterio que en la actualidad trabajo en un proyecto muy relacionado con el mundo del periodísmo por lo que día a día voy conociendo un poco más sus “tripas”.

Posiblemente una de las cosas que más me ha llamado la atención es el intercambio de información entre las agencias de noticias y sus clientes. Aunque no todas trabajan igual… sería facilitar demasiado el trabajo, si existen algunas normativas al respecto que se cumplen en mayor o menor medida: NITF y NewsML.

Especialmente me resulta curioso NewsML, todo un sistema de intercambio de información XML con un DTD muy bien definido y que permite incluir mucha información (texto, imagen, sonido, video, documental…). Facilita mucho la vida parsear esta clase de información y crear todos los contenedores de objetos; aunque no se cumpla al 100%, desde luego hay menos cosas a modificar que si cada agencia te envía su fichero de texto plano con su propio formato.

Por cierto, en mi caso lo estoy haciendo sobre Java y por si alguien quiere echarle un vistazo, Reuters publicó bajo open source una completa librería de parseo: http://newsml-toolkit.sourceforge.net/



Otros posts relacionados

  • Mauricio Henao

    Es interesante este formato del XML, tengo entendido que han sido cerca de 30 años de trabajo para lograr esto y definitivamente es un gran avance, aunque no he visto un archivo con esta estructura, chevere si lo tienes y lo compartes.

    Saludos.

  • Surt

    Me ha caído del cielo un regalito como parsear newsml.

    Dispongo de un xml simple, que requiere autentificación para acceder, y este con elementos con rutas a documentos en newsml nift tambien con autentificación.

    Desgraciadamente no dispongo de Java en el hosting y estoy tratando de encontrar la forma de parsearlos.

    ¿Existe algun XSL para estos dtd? eso me ahorraria tener que capturarlos y mostrarlos a mano.

blog comments powered by Disqus