NewsML – XML para las noticias

2

Posted on : 16-12-2008 | By : Carlos Cordero | In : Internet, Java, Software

No creo que sea un misterio que en la actualidad trabajo en un proyecto muy relacionado con el mundo del periodísmo por lo que día a día voy conociendo un poco más sus “tripas”.

Posiblemente una de las cosas que más me ha llamado la atención es el intercambio de información entre las agencias de noticias y sus clientes. Aunque no todas trabajan igual… sería facilitar demasiado el trabajo, si existen algunas normativas al respecto que se cumplen en mayor o menor medida: NITF y NewsML.

Especialmente me resulta curioso NewsML, todo un sistema de intercambio de información XML con un DTD muy bien definido y que permite incluir mucha información (texto, imagen, sonido, video, documental…). Facilita mucho la vida parsear esta clase de información y crear todos los contenedores de objetos; aunque no se cumpla al 100%, desde luego hay menos cosas a modificar que si cada agencia te envía su fichero de texto plano con su propio formato.

Por cierto, en mi caso lo estoy haciendo sobre Java y por si alguien quiere echarle un vistazo, Reuters publicó bajo open source una completa librería de parseo: http://newsml-toolkit.sourceforge.net/

Comparte este post
  • Digg
  • del.icio.us
  • Netvouz
  • DZone
  • Technorati
  • BarraPunto
  • Bitacoras.com
  • Facebook
  • FriendFeed
  • Google Bookmarks
  • LinkedIn
  • Live
  • Meneame
  • MySpace
  • Netvibes
  • Ping.fm
  • Tumblr
  • Twitter


Otros posts relacionados

Comments

Es interesante este formato del XML, tengo entendido que han sido cerca de 30 años de trabajo para lograr esto y definitivamente es un gran avance, aunque no he visto un archivo con esta estructura, chevere si lo tienes y lo compartes.

Saludos.

Me ha caído del cielo un regalito como parsear newsml.

Dispongo de un xml simple, que requiere autentificación para acceder, y este con elementos con rutas a documentos en newsml nift tambien con autentificación.

Desgraciadamente no dispongo de Java en el hosting y estoy tratando de encontrar la forma de parsearlos.

¿Existe algun XSL para estos dtd? eso me ahorraria tener que capturarlos y mostrarlos a mano.

Post a comment