<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>docecosas.com &#187; rantdocecosas.com</title>
	<atom:link href="http://docecosas.com/tag/rant/feed" rel="self" type="application/rss+xml" />
	<link>http://docecosas.com</link>
	<description>El sitio personal de Pablo Martínez Schroder</description>
	<lastBuildDate>Tue, 22 May 2012 12:42:55 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.2</generator>
		<item>
		<title>Las URL que mueren</title>
		<link>http://docecosas.com/blog/las-url-que-mueren.html</link>
		<comments>http://docecosas.com/blog/las-url-que-mueren.html#comments</comments>
		<pubDate>Thu, 08 Jan 2009 18:58:09 +0000</pubDate>
		<dc:creator>Pablo Martínez Schroder</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[internet]]></category>
		<category><![CDATA[rant]]></category>

		<guid isPermaLink="false">http://docecosas.com/?p=1496</guid>
		<description><![CDATA[He leido que uno de los blogs de Weblogs S.L. va a cerrar, se trata de Vive la ciudad y parte del anuncio menciona como dejará de existir el sitio: Este post es el último que publicaremos en esta plataforma, y estará online hasta el 30 de enero de 2009, fecha en la que apagaremos&#8230; <a href="http://docecosas.com/blog/las-url-que-mueren.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>He leido que uno de los blogs de Weblogs S.L. va a cerrar, se trata de <a hrev="http://www.vivelaciudad.es/">Vive la ciudad</a> y parte del anuncio menciona como dejará de existir el sitio:</p>
<figure id="attachment_1495" class="wp-caption thumbnail alignleft" style="width: 300px;">
				<a href="http://docecosas.com/wp-content/uploads/2009/01/http.jpg"><img src="http://docecosas.com/wp-content/uploads/2009/01/http.jpg" alt="Una URL cualquiera" title="http" width="300" height="225" class="size-full wp-image-1495" /></a>
				<figcaption class="wp-caption-text">Una URL cualquiera</figcaption>
			</figure>
<blockquote><p>Este post es el último que publicaremos en esta plataforma, y estará online hasta el 30 de enero de 2009, fecha en la que apagaremos la luz, y Vive la ciudad | Madrid dejará de estar accesible.</p></blockquote>
<p>Lo primero que pensé al ver esa nota fue que se producirá otro caso de <a href="http://www.w3.org/Provider/Style/URI">enlace roto</a>. Y se que es muy frecuente que haya sitios que cambien las direcciones o incluso que desaparezcan,  a veces es inevitable, pero en otras muchas otras ocasiones creo que habría que intentar evitarlos. Creo que es lógico pensar que a medida que los contenidos generados dependan más de cómo puedan ser rentabilizados, más ocurrirá que habrá direcciones que dejan de funcionar y la <em>Interweb</em> se irá transformando en algo más temporal y efímero.</p>
<p>Si ya hace 10 años en un <a href=http://www.useit.com/alertbox/980614.html">artículo de Nielsen sobre enlaces rotos</a> se indicaba el grave problema que suponía ¿qué podemos esperar hoy en día? Cada vez que veo un <em>elblockbusteractual-themovie.com</em> pienso cuánto tiempo existirá esa dirección ¿merecerá la pena enlazarlo sabiendo que dentro de uno, dos, quizás tres años ese enlace dejará de funcionar?.</p>
<p>Proyectos como <a href="http://www.archive.org">The Internet Archive</a> y su <a href="http://www.archive.org/web/web.php">Wayback Machine</a> pueden ayudar a que algunos enlaces puedan rescatarse para poder comprender el contexto, pero no siempre es así y no estoy seguro de que sea la solución. Creo que sería mejor intentar mantener alojado el contenido, en la mayoría de casos no serían necesarios muchos recursos si se planea un poco, y hay muchas posibilidades para solucionar los problemas que se producen si se reestructura la web (¡<a href="http://httpd.apache.org/docs/2.0/mod/mod_rewrite.html">mod_rewrite al rescate</a>!), así que me parece bastante pecaminoso dejar que esas ocurran.</p>
<p>Una parte de la web 2.0 parece que eran las URL amigables, ¿quizás haya que esperar a la web 3.0 para que además sean permanente? ¿o sólo sirven para técnicas SEO y aumentar la rentabilidad? Espero que algún día podamos enlazar una dirección con la tranquilidad de que pasados los años seguirá allí, por ahora me temo que no es así.</p>
]]></content:encoded>
			<wfw:commentRss>http://docecosas.com/blog/las-url-que-mueren.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>La crisis y las felicitaciones del 2009</title>
		<link>http://docecosas.com/blog/la-crisis-y-las-felicitaciones-del-2009.html</link>
		<comments>http://docecosas.com/blog/la-crisis-y-las-felicitaciones-del-2009.html#comments</comments>
		<pubDate>Mon, 05 Jan 2009 13:19:00 +0000</pubDate>
		<dc:creator>Pablo Martínez Schroder</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[rant]]></category>

		<guid isPermaLink="false">http://docecosas.com/?p=1493</guid>
		<description><![CDATA[He visto bastantes posts y declaraciones que transmiten la idea de que lo ideal es felicitar el año 2010, que este 2009 en el que estamos entrando (ya estaremos del todo cuando pasen los Reyes Magos) no tiene salvación y que mejor concentrarnos en el 2010, y la verdad es que me dejan un muy&#8230; <a href="http://docecosas.com/blog/la-crisis-y-las-felicitaciones-del-2009.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p>He visto bastantes posts y declaraciones que transmiten la idea de que lo ideal es felicitar el año 2010, que este 2009 en el que estamos entrando (ya estaremos del todo cuando pasen los Reyes Magos) no tiene salvación y que mejor concentrarnos en el 2010, y la verdad es que me dejan un muy mal sabor de boca esas opiniones.</p>
<p>Entiendo que no son serias al 100% pero creo que le dan más importancia de la que se debe a algo como una crisis financiera: efectivamente para todos esos que se quedan en paro sin recursos la cosa es una putada, pero lo sería aunque resultara que estuvieramos en el mejor momento de la historia económica. Además, un momento como este nos hará ser más ingeniosos y no creo que sea bueno dejar de disfrutar y pasar un mal año por algo que no nos toca de pleno. Si las cosas se han complicado, pues habrá que hacer más cena con los amigos y jugar a juegos en vez de tanto restaurante y cine. A lo mejor hay que usar menos coche y comprar otras cosas, pero estoy seguro de que todos podemos intentar disfrutar de todo esto.</p>
<p>Y a los que realmente estén pasandolo mal ¡mucho ánimo! Y que tengan un <strong>feliz 2009</strong>.</p>
]]></content:encoded>
			<wfw:commentRss>http://docecosas.com/blog/la-crisis-y-las-felicitaciones-del-2009.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Odiad UTF-8</title>
		<link>http://docecosas.com/blog/odiad-utf-8.html</link>
		<comments>http://docecosas.com/blog/odiad-utf-8.html#comments</comments>
		<pubDate>Tue, 15 Jan 2008 21:34:08 +0000</pubDate>
		<dc:creator>Pablo Martínez Schroder</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[greatests hits]]></category>
		<category><![CDATA[rant]]></category>
		<category><![CDATA[unicode]]></category>

		<guid isPermaLink="false">http://docecosas.com/articulo/odiad-utf-8</guid>
		<description><![CDATA[Una breve historia Podemos remontarnos a ASCII-7, una tabla de caracteres de 7 bits que representaba los carácteres más usuales del mundo anglosajón. Sin embargo ¿qué pasaba con los carácteres extranjeros? Para solucionarlo se creó ASCII extendido, esta vez con 8 bits y 256 carácteres disponibles, pero aún así no era suficiente para contentar a&#8230; <a href="http://docecosas.com/blog/odiad-utf-8.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<h3>Una breve historia</h3>
<p>Podemos remontarnos a <a href="http://es.wikipedia.org/wiki/ASCII">ASCII-7</a>, una tabla de caracteres de 7 bits que representaba los carácteres más usuales del mundo anglosajón. Sin embargo ¿qué pasaba con los carácteres extranjeros? Para solucionarlo se creó ASCII extendido, esta vez con 8 bits y 256 carácteres disponibles, pero aún así no era suficiente para contentar a todo el mundo, porque entre tildes, letras raras, signos y demás no podiamos meter todos los caracteres no-ingleses que necesitabamos en 128 carácteres que eran lo que nos dejaba ASCII extendido. Así que la solución fué crear distintos ASCII<br />
extendidos, las famosas iso-8859. Cada <a href="http://czyborra.com/charsets/iso8859.html">tabla de carácteres iso-8859</a> especificaba distintos carácteres, así cada país podía utilizar el juego de carácteres que mejor se adaptara a su grafía. En el caso español usábamos <a href="http://es.wikipedia.org/wiki/ISO-8859-1">iso-8859-1</a> que incluía la mayoría de carácteres europeos occidentales.</p>
<p>Problema resuelto ¿no? Pues puede que sí, al menos parcialmente. A menos que necesites escribir un texto con ñ (iso-8859-1) y un carácter arábico (iso-8859-6) pero tampoco es para tanto, vamos digo yo. Aunque ahora que lo pienso, si alguien me envía un texto con carácteres extendidos ¿cómo se que tabla está usando? Vaya, no puedo descubrirlo&#8230; pero tampoco es tan grave, ya lo resolverán las aplicaciones: los servidores web envían <a href="http://www.w3.org/International/O-HTTP-charset">la codificación del fichero</a>, y lo mismo ocurre en casi todas las demás cosas. Aunque todavía me queda saber cómo hace el servidor web para saber qué tipo de codificación utiliza un fichero HTML o .txt determinado. ¿Quizás no puede adivinarlo? Vaya, entonces tenemos un problema. Empiezo a pensar que esto de ASCII no es tan buena idea&#8230; 128 carácteres fijos y 128 que pueden cambiar y no se cuándo se usa cual no me parece divertido.</p>
<h3>Ya hemos descubierto el problema, ahora la solución</h3>
<p>Nos ha quedado claro que el problema que nos encontramos es que no podemos limitarnos a tener 128 carácteres fijos y luego que cada documento tenga un juego de 128 carácteres extendidos, porque no soluciona el problema del intercambio de documentos ni permite usar los carácteres que necesitemos en cada momento, nos vemos limitados a un juego.</p>
<p>Así que como solución surge <a href="http://www.unicode.org/">Unicode</a>. Un juego de carácteres universal capaz de identificar 2^32 carácteres (4.294.967.296), y en tantos carácteres pueden codificarse todas las grafias del mundo (incluso se intentó codificar la grafía Klingon :) ), presentes y pasadas. Así que genial, ahora tenemos un sistema de codificación que nos permite utilizar cualquier carácter y nuestros documentos podrán ser leidos por cualquiera. Si es que ya les pasó cuando hicieron ASCII extendido para ampliar ASCII-7, que se conformaron con duplicar las opciones y tendrían que haber ido a lo grande, pero nunca es tarde si la dicha es buena.</p>
<h3>Los peros</h3>
<p>Así que tenemos claro que usaremos Unicode para representar cadenas de texto, con sus 32 bits nos permiten codificar cualquier texto imaginable aunque esto tiene 2 graves consecuencias. El primero y más obvio es el tamaño de las cadenas. Este texto tiene unos 6.700 carácteres, lo que codificado como ISO-8859-15 son 6.700 bytes, sin embargo en Unicode eso serían casi 27.000 bytes, y aunque el ancho de banda y el espacio en memoria cada vez es menos problemático para almacenar texto, sigue siendo multiplicar por cuatro.</p>
<p>El otro inconveniente viene de utilizar un sistema de codificación nuevo y totalmente distinto. Hay que reescribir todas las funciones que estén relacionadas con las cadenas: medir el tamaño de una cadena, representarla, leerla, partirlas, unirlas, ordenaralas&#8230;. nada de lo que teniamos sirve y todo hay que reescribirlo.</p>
<p>Y a todo esto podemos tener una idea de lo engorroso que es mantener al mismo tiempo texto en Unicode y otros formatos, aunque tampoco es demasiado distinto a tener que trabajar con distintas codificaciones.</p>
<p>Así que como solución a parte de los problemas se crearon UTF-16 y UTF-8. El primero es una representación en palabras de 16 bits de los carácteres, de forma que la mayoría de carácteres puedan ser representados en 16 bits. Pero sigue teniendo la pega de que nos es necesario tener código capaz de trabajar, representar y leer esas cadenas. El otro invento fue UTF-8, que codifica los carácteres más utilizados en 8 bits y ahorra mucho espacio, y la realidad nos demuestra que vino para quedarse.</p>
<h3>Y el enemigo número 1: UTF-8</h3>
<p>UTF-8 no es tan malo: nos permite utilizar Unicode y ahorramos espacio ¿no? Sí, eso es verdad. Pero eso son efectos colaterales del verdadero objetivo del uso de UTF-8 que podemos descubrir recurriendo a un poco de historia.</p>
<p>Se supone que <a href="http://openmap.bbn.com/~tomlinso/ray/firstemailframe.html">el primer email de la historia</a> fue un texto de prueba, algo como QUERTYIOP y que tras<br />
esa prueba se enviaron otros mensajes. Ese primer mail se envió en 1971 y podriamos apostar a que estaba escrito en ASCII (que se presentó en 1967). Así que imaginad que cogemos todos esos mails que se enviaron hace más de 30 años en ASCII y que causaron tantos problemas de intercomunicación entre distintos idiomas, que dieron tantos quebraderos de cabeza (todo el que haya tenido que configurar consolas sabe de que estoy hablando) y de repente por arte de magia ¡son textos internacionales¡ ¡bendigamos a UTF-8!</p>
<p>Unicode pretende ser la respuesta a un problema complejo que se vió acentuado por el intercambio de información en a las redes informáticas. Solucionar el problema es engorroso: durante un periodo se producirán incompatibilidades entre programas y usuarios de Unicode y aplicaciones y usuarios que siguieran con juegos de caráceteres variados e incompatibles.</p>
<p>Si Unicode y todos los iso-8859 conviviesen existirían problemas en los que los textos serían totalmente incompatibles: una herramienta que no soporte Unicode mostrará un montón de basura ilegible y no podrá hacer nada con él, y lo mismo ocurriría en el caso contrario. Sin embargo UTF-8 surge como un intento de camuflar ese problema, de repente la solución es &#8220;compatible hacia atrás&#8221; y todos los textos escritos en ASCII-7 son también Unicode (UTF-8, pero Unicode a fin de cuentas). Y las rutinas de clasificación, de partir cadenas, los filtros, todo funciona perfectamente. Siempre y cuando sea ASCII-7, suficiente para los anglosajones.</p>
<p>En resumen, con UTF-8 se consigue adaptar una solución y degradarla para que no resulte demasiado molesta. Para que sólo &#8220;los que tienen el problema&#8221; tengan que lidiar con ella, con una solución intermedia, para no tener que saltar todos al tren del Unicode.</p>
<p>Por eso odio UTF-8. Porque es el mal menor y lo han hecho a posta.</p>
<hr />
<p>PS: Un excelente artículo sobre esta historia es &#8220;<a href="http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF">Characters vs. Bytes</a>&#8220;.</p>
]]></content:encoded>
			<wfw:commentRss>http://docecosas.com/blog/odiad-utf-8.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

