Jsoup un parser de html simplificado

Ya hace y explicaba cómo se podía recoger el contenido de una página web que no tenía webservice y por el contrario solo necesitábamos una pequeña parte. Era en este post con el html parser de java. También tendrás que vigilar que lo recogido no tenga derechos de autor o al menos poner su fuente.

Hace tiempo se explicaba como hacer scrapping de una pagina web donde es necesario recoger una parte de datos pero no se tiene los datos en un formato libre y legible. Hablábamos de HTMLParser, ahora usaremos una buena evolución.
Continúa leyendo Jsoup un parser de html simplificado

Parsear Xml en Android con SimpleXml

El caso que parsear xml en Android puede suponer más de un quebradero de cabeza eso es lo que me he encontrado precisamente estos días, al intentar usar clases standares de Java para lograrlo me saltaba el error que la clase no era compatible con las de Apache Harmony. Recordemos que Android usa Dalvik y aunque tiene un soporte inmenso en las librerías de Java, esta adaptado y pensado para correr en un dispositivo móvil y por estas razones no todo el núcleo esta completo.

Otras posibilidades sería hacerlo funcionar con SAX o DOM, SAX es más ligero al no construir todo el árbol XML como si lo hace DOM. Es decir DOM ocupara más memoria que SAX pero nos permitirá navegar por la estructura del XML. Normalmente si recibes una respuesta de un webservices, con SAX tienes más que suficiente.

En este caso pretendía usar XML como persistencia del programa Android, con las ventajas de poderlo exportar/importar, etc. Dom se ajustaba al perfil al poder recorrer el árbol en XML y luego editar o añadir un item, pero no esta soportado en Android, recordemos que es el más lento y en la mayoría de casos que necesitamos parsear un XML de  una fuente externa con SAX o XMLPULL nos basta y son eficientes.

Para este proyecto he encontrado ideal el framework de XML llamado Simple XML Serialization.

Continúa leyendo Parsear Xml en Android con SimpleXml