<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>intraEmprendedor.com &#187; cubos</title>
	<atom:link href="http://www.intraemprendedor.com/tag/cubos/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.intraemprendedor.com</link>
	<description></description>
	<lastBuildDate>Thu, 19 Jan 2012 15:40:18 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Es Qlikview realmente tan bueno como lo pintan?</title>
		<link>http://www.intraemprendedor.com/2009/11/19/es-qlikview-realmente-tan-bueno-como-lo-pintan/</link>
		<comments>http://www.intraemprendedor.com/2009/11/19/es-qlikview-realmente-tan-bueno-como-lo-pintan/#comments</comments>
		<pubDate>Thu, 19 Nov 2009 07:31:33 +0000</pubDate>
		<dc:creator>intraemprendedor</dc:creator>
				<category><![CDATA[Negocios]]></category>
		<category><![CDATA[Tecnologia]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[cubos]]></category>
		<category><![CDATA[datawarehouse]]></category>
		<category><![CDATA[innovacion]]></category>
		<category><![CDATA[inteligencia de negocios]]></category>
		<category><![CDATA[Qlikview]]></category>

		<guid isPermaLink="false">http://www.intraemprendedor.com/?p=318</guid>
		<description><![CDATA[Recientemente me tocó ver de cerca una demo de Qlikview para un cliente que buscaba generar reportes más rápidos de su Datawarehouse. En esta demo, lo menos que escuché de Qlikview y los consultores que lo acompañaban es que es tecnología de la NASA y que junto con Pinky dominará al mundo. En este artículo [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.intraemprendedor.com/wp-content/uploads/2009/11/qlikview.jpg"><img class="alignleft size-medium wp-image-319" title="qlikview" src="http://www.intraemprendedor.com/wp-content/uploads/2009/11/qlikview-300x225.jpg" alt="" width="300" height="225" /></a>Recientemente me tocó ver de cerca una demo de Qlikview para un cliente que buscaba generar reportes más rápidos de su Datawarehouse. En esta demo, lo menos que escuché de Qlikview y los consultores que lo acompañaban es que es tecnología de la NASA y que junto con Pinky dominará al mundo. En este artículo resalto algunos de los beneficios y algunas dudas, para ver si alguien quiere comentar lo que opina al respecto.<span id="more-318"></span></p>
<p><script type="text/javascript"><!--
google_ad_client = "pub-9957519081964656";
google_ad_channel = "intraemprendedor.com";
google_ad_width = 728;
google_ad_height = 15;
google_ad_format = "728x15_0ads_al_s";
google_alternate_ad_url = "http://www.mangohosting.com/es/index.php";
google_color_border = "FFFFFF";
google_color_bg = "FFFFFF";
google_color_link = "0000FF";
google_color_text = "000000";
google_color_url = "0000FF";

//--></script>
<script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
<br />
Las ventajas que noté respecto a los reporteadores o herramientas de BI &#8220;tradicionales&#8221; son obviamente la velocidad de generación de reportes, el drill-down y  la interfaz &#8220;ajaxcificada&#8221; principalmente.</p>
<p>Dentro de las cosas que me llamaron la atención fue la reducción importante de espacio de almacenamiento después de convertir los datos al formato binario (QVD). La lentitud de la carga de datos también es notoria, por lo que para Datawarehouses grandes o cambiantes, es importante definir una estrategia incremental o meterse a programar los scripts de su ETL embebido de manera eficiente.</p>
<p>El modelo tan mencionado de &#8220;memoria asociativa&#8221; puede ser realmente muy superior al modelo relacional en memoria, pero pienso que para algunos escenarios, el modelo relacional en memoria puede ser suficiente para lograr resultados similares. Y siendo consecuentes con la hipótesis de que la memoria tiende a bajar de precio, entonces el hecho de que el modelo relacional ocupe más espacio que su modelo propietario asociativo realmente no importa tanto si se obtiene un desempeño similar.</p>
<p>Observando las demos y algunos de los casos que presentan, noté algunos escenarios donde se puede resolver de manera muy fácil con otra herramienta de analysis o reporteo como SQL Analysis y Reporting Services o similares.</p>
<p>Es importante mencionar, que Qlikview no reemplaza los Datawarehouses, ya que aún se necesita una fuente de datos confiable y consolidada. Es generalmente aceptado que Qlikview es más una herramienta de reporteo, aunque aparece en el cuadrante mágico de Gartner dentro de las herramientas de Business Intelligence.</p>
<p>Tal como lo he mencionado, las decisiones de inversión deben ser guiadas más sobre la premisa de usar la herramienta apropiada para el problema indicado; sin querer resolver cualquier problema con la herramienta de moda solo por el hecho de estarlo.</p>
<p>Por último, lo que más me sorprende de QlikTech, la compañia detrás de Qlikview es su ingenio y capacidad de penetración en un mercado saturado, con el enfoque de marketing adecuado y con mensajes claros y precisos.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.intraemprendedor.com/2009/11/19/es-qlikview-realmente-tan-bueno-como-lo-pintan/feed/</wfw:commentRss>
		<slash:comments>26</slash:comments>
		</item>
		<item>
		<title>Que es una Slowly Changing Dimension (SCD), what the hell 2</title>
		<link>http://www.intraemprendedor.com/2009/11/13/que-es-una-slowly-changing-dimension-scd-what-the-hell-2/</link>
		<comments>http://www.intraemprendedor.com/2009/11/13/que-es-una-slowly-changing-dimension-scd-what-the-hell-2/#comments</comments>
		<pubDate>Fri, 13 Nov 2009 05:22:20 +0000</pubDate>
		<dc:creator>intraemprendedor</dc:creator>
				<category><![CDATA[Negocios]]></category>
		<category><![CDATA[Tecnologia]]></category>
		<category><![CDATA[base de datos]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[business objects]]></category>
		<category><![CDATA[cubos]]></category>
		<category><![CDATA[datawarehouse]]></category>
		<category><![CDATA[inteligencia comercial]]></category>
		<category><![CDATA[proyectos]]></category>
		<category><![CDATA[SAP]]></category>

		<guid isPermaLink="false">http://www.intraemprendedor.com/?p=310</guid>
		<description><![CDATA[Una historieta más del proyecto de Business Intelligence que recientemente me mantuvo ocupado. Este término causó muchas bromas, por que a mi amigo Mike de Guadalajara le parecía que el consultor sacó sus mejores términos domingueros para denotar el tipo de dato en cuestión. La realidad es que se estaba (o está?) utilizando un dato [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.intraemprendedor.com/wp-content/uploads/2009/11/datawarehousing.jpg"><img class="alignleft size-medium wp-image-311" title="datawarehousing" src="http://www.intraemprendedor.com/wp-content/uploads/2009/11/datawarehousing.jpg" alt="" width="300" height="200" /></a>Una historieta más del proyecto de Business Intelligence que recientemente me mantuvo ocupado. Este término causó muchas bromas, por que a mi amigo Mike de Guadalajara le parecía que el consultor sacó sus mejores términos domingueros para denotar el tipo de dato en cuestión. La realidad es que se estaba (o está?) utilizando un dato que en realidad es una dimensión como parte de una tabla de hechos.<span id="more-310"></span></p>
<p><script type="text/javascript"><!--
google_ad_client = "pub-9957519081964656";
google_ad_channel = "intraemprendedor.com";
google_ad_width = 728;
google_ad_height = 15;
google_ad_format = "728x15_0ads_al_s";
google_alternate_ad_url = "http://www.mangohosting.com/es/index.php";
google_color_border = "FFFFFF";
google_color_bg = "FFFFFF";
google_color_link = "0000FF";
google_color_text = "000000";
google_color_url = "0000FF";

//--></script>
<script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
En un Data Warehouse, el término dimensión se refiere a un grupo lógico de datos tal como una localidad geográfica u organizacional sobre los datos de la empresa.</p>
<p>Una Dimensión que cambia con el tiempo es una <strong>Slowly Changing Dimensions (SCD)</strong> es decir una dimensión que contiene datos que cambian lentamente. Por ejemplo, puede ser una dimensión que permite analizar las ventas de una empresa agrupada por vendedores. Todos los reportes regionales funcionan bien, hasta que un vendedor se mueve de una región o país hacia otra. Como mantienes ese cambio en la Dimensión de ventas?</p>
<p>Podrías obtener un promedio de las ventas anuales por vendedor, pero si se utiliza esto como un indicador de desempeño de los vendedores, esto podría dar información incorrecta. Si el vendedor se movió de una región muy productiva a una región con menos clientes, su promedio será superior al resto de los vendedores aún si su desempeño no es realmente mejor. O podrías crear un nuevo registro de vededor y tratarlo como una entidad distinta, pero eso también trae problemas ya que no se tendrían los totales.</p>
<p>Existen algunas metodologías para tratar este problema del tipo 0,1,2,3,4 y  6 que se explican brevemente a continuación.</p>
<p>Tipo 0. Este es un enfoque pasivo, es decir no se hace nada al respecto. Los valores permanecen como estaba la dimensión cuando los registros fueron creados. No es el tipo más usado.</p>
<p>Tipo 1. En este enfoque se sobreescriben los datos viejos con el dato actualizado sin mantener el historial de  donde perteneció. Este enfoque es sencillo, pero tiene la desventaja de que no contiene historia.</p>
<p>Tipo 2.  En este enfoque se inserta un nuevo registro cada vez que existe un cambio en la dimensión. Se agrega un campo de versión u opcionalmente se agregan dos columnas para capturar la fecha de inicio y final de ese valor. Con este método se puede relacionar fácilmente el período de tiempo para el cual es válido cierto dato en la dimensión pero no es muy sencillo de mantener sobretodo si el modelo dimensional cambia a menudo.</p>
<p>Tipo 3. Este método da seguimiento al cambio agregando nuevas columnas. Una columna  mantendría el dato de la región original de un vendedor por ejemplo, y otra la nueva región o actual, así como una columna de fecha efectiva del cambio. Este enfoque solo puede mantener un cambio histórico, a diferencia del Tipo 2 que puede mantener cambios ilimitados en la historia.</p>
<p>Tipo 4. Este método mantiene una tabla histórica para todos los cambios y una tabla con el valor actual de la dimensión.</p>
<p>Tipo 6 / Híbrido. Este método es una combinación de los Tipos 1,2 y 3 (1 + 2 + 3 = 6. El enfoque es usar una Dimensión TIpo 1 (escribiendo el dato actual), pero agregar un par adicional de columnas con las fechas de validez (TIpo 2).</p>
<p>Otras alternativas son usar un número de versión para cada nuevo renglón tal como el método de Tipo 2.</p>
<p>Los registros deben tener la llave de la tabla de Dimensión como una llave foránea (aunque no es un join a una única columna) en combinación con un filtro de fecha.  Para permitir historial de Tipo 2, las transacciones también podrían tener columnas para referenciar al número de versión aunque tomando las consideraciones de desempeño del Tipo 2.</p>
<p>No es necesario tener una bandera del dato actual en la dimensión o una llave para cada registro pero puede simplificar las consultas y la administración respectivamente.</p>
<p>Note que los Hechos debería tener solamente una fecha para representar la fecha en que ocurrió. Si se tienen múltiples fechas considerar dividir las transacciones de manera más granular.</p>
<p>No pretendo dejar resueltas todas las dudas sobre el manejo de estas dimensiones; sino solamente despertar el interés por aplicarlas y entenderlas.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.intraemprendedor.com/2009/11/13/que-es-una-slowly-changing-dimension-scd-what-the-hell-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Vistas materializadas for dummies, what the hell?</title>
		<link>http://www.intraemprendedor.com/2009/11/12/vistas-materializadas-for-dummies-what-the-hell/</link>
		<comments>http://www.intraemprendedor.com/2009/11/12/vistas-materializadas-for-dummies-what-the-hell/#comments</comments>
		<pubDate>Thu, 12 Nov 2009 14:21:42 +0000</pubDate>
		<dc:creator>intraemprendedor</dc:creator>
				<category><![CDATA[Negocios]]></category>
		<category><![CDATA[Tecnologia]]></category>
		<category><![CDATA[base de datos]]></category>
		<category><![CDATA[BI]]></category>
		<category><![CDATA[Business Intelligence]]></category>
		<category><![CDATA[cubos]]></category>
		<category><![CDATA[datawarehouse]]></category>
		<category><![CDATA[DB]]></category>
		<category><![CDATA[vistas]]></category>

		<guid isPermaLink="false">http://www.intraemprendedor.com/?p=307</guid>
		<description><![CDATA[No creo ser la persona más capacitada para hablar de las vistas materializadas (materialized views), pero como me llamó la atención el tema lo haré, con el apoyo de algunos artículos y quizá mi amigo Pablo López de Guadalajara pueda complementar algo más tarde. De manera introductoria les diré, que los tiempos como resultado de [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.intraemprendedor.com/wp-content/uploads/2009/11/datawarehouse.jpg"><img class="alignleft size-full wp-image-308" title="datawarehouse" src="http://www.intraemprendedor.com/wp-content/uploads/2009/11/datawarehouse.jpg" alt="" width="373" height="255" /></a>No creo ser la persona más capacitada para hablar de las vistas materializadas (<em>materialized views</em>), pero como me llamó la atención el tema lo haré, con el apoyo de algunos artículos y quizá mi amigo Pablo López de Guadalajara pueda complementar algo más tarde. <span id="more-307"></span></p>
<p>De manera introductoria les diré, que los tiempos como resultado de usar vistas materializadas en un proyecto donde teníamos reportes con consultas (queries) que duraban hasta más de 1 minuto, se redujeron a segundos.<br />
<script type="text/javascript"><!--
google_ad_client = "pub-9957519081964656";
google_ad_channel = "intraemprendedor.com";
google_ad_width = 728;
google_ad_height = 15;
google_ad_format = "728x15_0ads_al_s";
google_alternate_ad_url = "http://www.mangohosting.com/es/index.php";
google_color_border = "FFFFFF";
google_color_bg = "FFFFFF";
google_color_link = "0000FF";
google_color_text = "000000";
google_color_url = "0000FF";

//--></script>
<script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
<br />
En un Sistema de base de datos relacional (RDBMS) una vista es una tabla virtual que representa el resultado de un Query.  Siempre que se consulta o se actualiza una vista normal, el RDBMS convierte estas operaciones en queries o actualizaciones de las tablas usadas para definir la vista.</p>
<p>Una <strong>vista materializada</strong> utiliza una enfoque diferente, ya que el resultado de la consulta se almacena en una tabla cache real, que será actualizada de forma periódica a partir de las tablas originales. Esto proporciona un acceso mucho más eficiente, a costa de un incremento en el tamaño de la base de datos y a una posible falta de sincronía, es decir, que los datos de la vista pueden estar potencialmente desfasados con respecto a los datos reales.</p>
<p>Esto es una solución muy utilizada en entornos de Datawarehousing donde el acceso frecuente a las tablas fuente resulta demasiado lento.</p>
<p>Además, dado que la vista se almacena como una tabla real, se puede hacer con ella lo mismo que con cualquier otra tabla, siendo especialmente importante la capacidad de crear indices en cualquier columna, lo cual puede aumentar significativamente la velocidad de las consultas.</p>
<p>En una vista normal, lo más común es que sólo se permita utilizar índices sobre aquellas columnas que ya tienen definido un índice en la tabla original; a veces ni siquiera se ofrece esa posibilidad.</p>
<p>Una sentencia típica de SQL para definir una Vista materializada:</p>
<p>CREATE MATERIALIZED VIEW nombre_vista<br />
[TABLESPACE nombre_ts]<br />
[PARALELL (DEGREE n)]<br />
[BUILD {INMEDIATE|DEFERRED}]<br />
[REFRESH {FAST|COMPLETE|FORCE|NEVER}|{ON COMMIT|ON DEMAND|[START WITH fecha_inicio] NEXT intervalo}]<br />
[{ENABLE|DISABLE} QUERY REWRITE]<br />
AS SELECT &#8230; FROM &#8230; WHERE &#8230;</p>
<p align="left">Con la <em>sentencia BUILD</em> se establece la forma de carga      de datos en la vista. Con la opción <em>INMEDIATE</em> (opción      por defecto) se cargarán los datos justo después de crear la      vista, mientras que con la opción <em>DEFERRED</em> se definirá      la vista cuando se ejecute la sentencia <em>SQL</em> sin cargar ningún      dato, que se cargarán cuando se realize el primer refresh de la vista.</p>
<p align="left">Con la palabra <em>REFRESH</em> definimos el método y      la frecuencia de actualización de los datos.</p>
<p align="left">La palabra <em>QUERY REWRITE</em> establece si queremos que      el <strong>optimizador</strong> de nuestra base de datos pueda reescribir      las consultas. El optimizador, sabiendo que ya existe una determinada vista      materializada, puede modificar internamente nuestra consulta sobre una determinada      tabla, de tal forma que se mejore el rendimiento de la consulta devolviendo      los mismos datos que la consulta original.</p>
<p>En el proyecto en cuestión, la base  de datos es DB2, aunque diversos gestores de base de datos cuentan con esta funcionalidad. De hecho el RDBMS que lo introdujo fue Oracle.<script type="text/javascript"><!--
google_ad_client = "pub-9957519081964656";
google_ad_channel = "intraemprendedor.com";
google_ad_width = 728;
google_ad_height = 15;
google_ad_format = "728x15_0ads_al_s";
google_alternate_ad_url = "http://www.mangohosting.com/es/index.php";
google_color_border = "FFFFFF";
google_color_bg = "FFFFFF";
google_color_link = "0000FF";
google_color_text = "000000";
google_color_url = "0000FF";

//--></script>
<script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
</p>
]]></content:encoded>
			<wfw:commentRss>http://www.intraemprendedor.com/2009/11/12/vistas-materializadas-for-dummies-what-the-hell/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

