chmtopdf: conversor de archivos chm

¿Qué es esto? Lo mismo digo. Hace como mucho una semana empezamos un proyecto con el Guille, para hacer un programa que convierta los archivos CHM (formato de ayuda HTML comprimido de Microsoft) a cualquier otro formato que sea imprimible. Ya que algunas editoriales ofrecen en internet libros en este formato, o incluso directamente en HTML, de forma gratuita.

La idea salió cuando estaba en mi casa con ganas de leer algo nuevo de Python y seguir estudiando inglés. Busqué algunos libros en internet y encontré. Pero otra vez lo mismo que cuando quise leer uno de TurboGears, es muy pesado leer desde el monitor, al menos para mí. Entonces dije: ¿Y porque no hacer un programa que descomprima el CHM y lo pase a formato PDF con lo que aprendí de LaTeX? Si esto se cumpliera me quedaría un libro de primera calidad, igual a cualquiera de una editorial o muy similar al menos.

En ese momento, levanté el teléfono y llamé al Guille. Le comenté la idea y me dijo que en cuanto pueda se venía para casa a empezar a pensar el sistema. Así fue como comenzó el desarrollo de esta aplicación, revolviendo viejos conceptos que alguna vez había manejado con el módulo BeautifulSoup para parsear los HTML (de hecho, excelente módulo) empezamos a ver qué podíamos hacer y cómo encarábamos el problema. También hubo que hacer memoria de HTML, CSS, y demás conceptos que estaban bastante olvidados.

Así y todo, programando dos días seguidos, con varias ilusiones y desilusiones en el medio, llegamos a algo muy crudo esos dos días que estuvimos. Pero ya se acercaba a lo que estábamos buscando. El problema era que sólo funcionaba para un archivo chm y no se podía configurar desde ningún punto de vista.

Los principales problemas fueron la inserción de los caracteres correctos en LaTeX, las tablas HTML, las viñetas, y otas cosas raras de HTML y CSS que muchas no son tan estándares como parece al principio. O mejor dicho quizás son estándares pero bastante bien mezclados y rompe coco😛 .

Nos juntamos una vez más (sólo medio día) y terminamos sacando la primer versión configurable del programa. Bastante cruda y difícil de llevar a cabo la configuración, pero configurable al fin. Incluso hasta ahora no sabemos bien cómo hacer para que cualquier usuario con desconocimiento de todos los conceptos mencionados pueda convertir su chm a pdf.

Actualmente el proyecto está disponible en internet, se puede descargar el código fuente y realizar cualquier tipo de pruebas con él. Proponer ideas, correción de bugs, y demás. Estamos abierto a cualquier sugerencia que sea.

En la Página Oficial del proyecto está una explicación de cómo se usa, hay un ejemplo de los resultados que se obtienen y demás.

2 pensamientos en “chmtopdf: conversor de archivos chm

  1. Miguel dice:

    Hola Manuel,

    Llego a tu blog por medio de PlanetUbuntu, iniciativa de la que espero formar parte pronto. Lo he encontrado muy interesante y voy a ver si lo ojeo a fondo, veo que programas Python como yo, y que también tuviste que aprender C a nivel universitario, es bueno ver que no soy el único.

    Bueno tu proyecto de chmtopdf me parece muy muy interesante. Yo busco esta aplicación de una forma u otra desde hace tiempo. Así que voy a ver si puedo echarle un ojo al código y aportar algo. Aunque será dentro de dos semanas, ya que estoy de parciales y en general soy una persona muy atareada entre trabajar y estudiar.

    Aún así el proyecto ya tiene muy buena pinta! Bueno, nada más,

    Un saludo

  2. humitos dice:

    Miguel: la verdad que me pone muy contento que llegues a mi blog por medio del planeta de ubuntu, ya que recién hoy me agregaron a este. Parece que tiene mucho movimiento.

    Python es mi lenguaje de cabecera y hace dos años por lo menos que estoy estudiando este, estos últimos meses me he dedicado bastante a leer libros y demás.

    Con respecto a este proyecto, es bastante nuevo, tiene a lo sumo dos o tres semanas, y no una dedicación full-time ni mucho menos, lo hacemos en los momentos en los cuales tenemos libres.

    Nos encantaría que puedas ver el código y sugieras cambios, mejoras, porciones de código ¿porqué no? y todo lo que quieras comentar será tenido en cuenta.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: