Descarga este blog
Por primera vez en los siete años desde que llevamos escribiendo este blog, el servidor de Google en el que estamos alojados se ha caído. Es obvio que el blog ha estado caído en más ocasiones pero nunca habíamos vivido una de estas situaciones en directo. No poder acceder al blog en el momento en el que quieres es muy irritante y eso me hizo pensar en una solución al problema.
En realidad no es una solución sino más bien un apaño ya que no puedo acceder a la infraestructura de los servidores de Blogger y no voy a migrar a wordpress u otras alternativas que permitieran el auto-hospedaje.
Lo más fácil es descargar el blog en su totalidad para poder acceder si hay problemas en el servidor. Además, permite mantener una copia de seguridad en caso de que este blog sea censurado en el futuro (con la Ley Mordaza tampoco me extrañaría) y ser accesible en cualquier zona sin internet, que alguna queda todavía.
Es tan sencillo como ejecutar un comando wget aderezado con las flags pertinentes. A continuación, pongo un resumen de las funciones de los flags, sacado del manual de wget:
- m: Turn on options suitable for mirroring. This option turns on recursion and time-stamping, sets infinite recursion depth and keeps FTP directory listings.
- k: After the download is complete, convert the links in the document to make them suitable for local viewing. This affects not only the visible hyperlinks, but any part of the document that links to external content, such as embedded images, links to style sheets, hyperlinks to non-HTML content, etc.
- E: If a file of type application/xhtml+xml or text/html is downloaded and the URL does not end with the regexp \.[Hh][Tt][Mm][Ll]?, this option will cause the suffix .html to be appended to the local filename.
- p: This option causes Wget to download all the files that are necessary to properly display a given HTML page. This includes such things as inlined images, sounds, and referenced stylesheets.
- np: Do not ever ascend to the parent directory when retrieving recursively. This is a useful option, since it guarantees that only the files below a certain hierarchy will be downloaded.
Si he puesto la explicación de cada flag es porque lo creo necesario, de cara al futuro. No todos los comandos de wget sirven para descargar todas las webs. Por la web circulan distintas alternativas que no funcionan y yo he tenido que ensamblar esta, a base de probar muchas opciones e ir afinando. Este solo sirve para descargar blogs de Blogger, en la fecha de publicación de este post. Si cambian alguna configuración del servidor, este comando puede empezar a desarrollar un comportamiento erróneo o inútil, así que no garantizo que en el futuro siga funcionando. El comando final resulta ser:
wget -mkEpnp www.lunaticgeek.com