<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1405-7743</journal-id>
<journal-title><![CDATA[Ingeniería, investigación y tecnología]]></journal-title>
<abbrev-journal-title><![CDATA[Ing. invest. y tecnol.]]></abbrev-journal-title>
<issn>1405-7743</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México, Facultad de Ingeniería]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1405-77432007000300004</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Descripción del nuevo estándar de video H.264 y comparación de su eficiencia de codificación con otros estándares]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Ochoa-Domínguez]]></surname>
<given-names><![CDATA[H.de J.]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Mireles-García]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Cota-Ruíz]]></surname>
<given-names><![CDATA[J. de D.]]></given-names>
</name>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Autónoma de Ciudad Juárez Instituto de Ingeniería y Tecnología Departamento de Ingeniería Eléctrica y Computación]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2007</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2007</year>
</pub-date>
<volume>8</volume>
<numero>3</numero>
<fpage>157</fpage>
<lpage>180</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S1405-77432007000300004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S1405-77432007000300004&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S1405-77432007000300004&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Los estándares de video han sido desarrollados con el fin de satisfacer una amplia gama de aplicaciones, como son: el almacenamiento digital, transmisión y recepción de multimedia, CATV, DVD, video conferencia, indexado de multimedia, cinema digital, entre otras. Los estándares de video logran una alta compresión utilizando varios métodos que explotan las redundancias temporal y espacial. El nuevo estándar de video H.264/MPEG-4 parte 10, no sólo es eficiente para el almacenamiento de video, sino que también proporciona un alto rendimiento en compresión y es más robusto a errores de transmisión que sus antecesores MPEG-2, H.263 y MPEG-4 parte 2. El presente artículo describe al estándar H.264/MPEG-4 parte 10. Primero se describe el algoritmo de codificación y posteriormente se compara su eficiencia de la codificación contra otros estándares anteriores existentes. Las comparaciones demuestran que el H.264 tiene una eficiencia de codificación de aproximadamente 1.5 veces mayor, en cada secuencia de prueba, con relación a otros estándares.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Video standards have been developed to fulfill a wide range of applications such as digital storage, multimedia transmission and reception, CATV, DVD, video conferencing, multimedia indexing, digital cinema among others. Video standards develop high compression ratios using several methods to reduce temporal and spatial redundancies. The new video standard, H.264/MPEG-4 part 10, not only is efficient to store video but also to obtain a higher coding efficiency and error resilience than the previous similar standards MPEG-2, H.263 and MPEG-4 part 2. In this article, we describe the new video standard H.264/MPEG-4 part 10. First, we describe the coding algorithm, and then we compare its coding efficiency versus the previous existing standards . Comparisons show that the new standard has a coding efficiency of about 1.5 times, in each test sequence, as compared to the other standards.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Codificación de video]]></kwd>
<kwd lng="es"><![CDATA[CAVLC]]></kwd>
<kwd lng="es"><![CDATA[CABAC]]></kwd>
<kwd lng="es"><![CDATA[H.264]]></kwd>
<kwd lng="es"><![CDATA[MPEG4 parte 10]]></kwd>
<kwd lng="es"><![CDATA[NAL]]></kwd>
<kwd lng="es"><![CDATA[predicción intra cuadro]]></kwd>
<kwd lng="es"><![CDATA[predicción ínter cuadro]]></kwd>
<kwd lng="es"><![CDATA[filtro de desbloqueo]]></kwd>
<kwd lng="en"><![CDATA[Video coding]]></kwd>
<kwd lng="en"><![CDATA[H.264]]></kwd>
<kwd lng="en"><![CDATA[Intra coding]]></kwd>
<kwd lng="en"><![CDATA[intercoding]]></kwd>
<kwd lng="en"><![CDATA[CAVLC]]></kwd>
<kwd lng="en"><![CDATA[CABAC]]></kwd>
<kwd lng="en"><![CDATA[MPEG4 part 10]]></kwd>
<kwd lng="en"><![CDATA[NAL]]></kwd>
<kwd lng="en"><![CDATA[deblocking filter]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="justify"><font face="verdana" size="4">Estudios e investigaciones recientes</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="center"><font face="verdana" size="4"><b>Descripci&oacute;n del nuevo est&aacute;ndar de video H.264 y comparaci&oacute;n de su eficiencia de codificaci&oacute;n con otros est&aacute;ndares</b></font></p>     <p align="center"><font face="verdana" size="2">&nbsp;</font></p>     <p align="center"><font face="verdana" size="2"><b>H.de J. Ochoa&#150;Dom&iacute;nguez, J. Mireles&#150;Garc&iacute;a, J. de D. Cota&#150;Ru&iacute;z</b></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>Departamento de Ingenier&iacute;a El&eacute;ctrica y Computaci&oacute;n Instituto de Ingenier&iacute;a y Tecnolog&iacute;a de la Universidad Aut&oacute;noma de Ciudad Ju&aacute;rez    <br> </i><b>E&#150;mail:</b> <a href="mailto:hochoa@uacj.mx">hochoa@uacj.mx</a></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2">Recibido: septiembre de 2005    ]]></body>
<body><![CDATA[<br> Aceptado: diciembre de 2006</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>     <p align="justify"><font face="verdana" size="2">Los est&aacute;ndares de video han sido desarrollados con el fin de satisfacer una amplia gama de aplicaciones, como son: el almacenamiento digital, transmisi&oacute;n y recepci&oacute;n de multimedia, CATV, DVD, video conferencia, indexado de multimedia, cinema digital, entre otras. Los est&aacute;ndares de video logran una alta compresi&oacute;n utilizando varios m&eacute;todos que explotan las redundancias temporal y espacial. El nuevo est&aacute;ndar de video H.264/MPEG&#150;4 parte 10, no s&oacute;lo es eficiente para el almacenamiento de video, sino que tambi&eacute;n proporciona un alto rendimiento en compresi&oacute;n y es m&aacute;s robusto a errores de transmisi&oacute;n que sus antecesores MPEG&#150;2, H.263 y MPEG&#150;4 parte 2. El presente art&iacute;culo describe al est&aacute;ndar H.264/MPEG&#150;4 parte 10. Primero se describe el algoritmo de codificaci&oacute;n y posteriormente se compara su eficiencia de la codificaci&oacute;n contra otros est&aacute;ndares anteriores existentes. Las comparaciones demuestran que el <i>H.264 </i>tiene una eficiencia de codificaci&oacute;n de aproximadamente 1.5 veces mayor, en cada secuencia de prueba, con relaci&oacute;n a otros est&aacute;ndares.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Descriptores: </b>Codificaci&oacute;n de video, CAVLC, CABAC, H.264, MPEG4 parte 10, NAL, predicci&oacute;n intra cuadro, predicci&oacute;n &iacute;nter cuadro, filtro de desbloqueo.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b><i>Abstract</i></b></font></p>     <p align="justify"><font face="verdana" size="2"><i>Video standards have been developed to fulfill a wide range of applications such as digital storage, multimedia transmission and reception, CATV, DVD, video conferencing, multimedia indexing, digital cinema among others. Video standards develop high compression ratios using several methods to reduce temporal and spatial redundancies. The new video standard, H.264/MPEG&#150;4 part 10, not only is efficient to store video but also to obtain a higher coding efficiency and error resilience than the previous similar standards MPEG&#150;2, H.263 and MPEG&#150;4 part 2. In this article, we describe the new video standard H.264/MPEG&#150;4 part 10. First, we describe the coding algorithm, and then we compare its coding efficiency versus the previous existing standards . Comparisons show that the new standard has a coding efficiency of about 1.5 times, in each test sequence, as compared to the other standards.</i></font></p>     <p align="justify"><font face="verdana" size="2"><b><i>Keywords:</i></b><i> Video coding, H.264, Intra coding, intercoding, CAVLC, CABAC, MPEG4 part 10, NAL, deblocking filter.</i></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2">Desde principios de los 90's, el grupo de expertos en codificaci&oacute;n de video (VCEG , <i>Video Coding Expert Group) </i>de la Uni&oacute;n Internacional de Telecomunicaciones &#150; Sector Telecomunicaciones (ITU&#150;T, <i>International </i><i>Telecommunication Union&#150; Telecommunication </i><i>sector) y </i>el grupo de expertos para im&aacute;genes en movimiento (MPEG, <i>Moving Picture Expert </i><i>Group) </i>de la ISO/IEC, enfocaron sus investigaciones en las diferentes t&eacute;cnicas de codificaci&oacute;n de video para diversas aplicaciones. En un inicio, la ITU&#150;T desarroll&oacute; el est&aacute;ndar H.261 (ITU&#150;T H261, 1993) para aplicaciones de video conferencia; por otra parte, MPEG proces&oacute; el MPEG&#150;1 (ISO/IEC 11172&#150;2:1993, 1993), cuya intensi&oacute;n inicial era para el almacenamiento de video en disco compacto (CD). Posteriormente, el grupo MPEG desarroll&oacute; el est&aacute;ndar MPEG&#150;2 como una extensi&oacute;n del MPEG&#150;1, cuya aplicaci&oacute;n inicial era televisi&oacute;n digital est&aacute;ndar (SDT) y televisi&oacute;n de alta definici&oacute;n (HDTV) (ISO/IEC JTC1/ SC29/WG11, 1994). Al mismo tiempo, la ITU&#150;T lo adopt&oacute; como el est&aacute;ndar H.262 (ITU&#150;T H.262, 2000). Estos est&aacute;ndares basan su operaci&oacute;n por la divisi&oacute;n en rebanadas de los cuadros de video de entrada. A su vez, estas rebanadas de video se subdividen en macrobloques, que por &uacute;ltimo se dividen en bloques. Debido a la necesidad de cubrir un mayor rango de aplicaciones, la ISO/IEC desarroll&oacute; el est&aacute;ndar MPEG&#150;4 parte 2, que puede operar de dos formas, la primera se basa en la divisi&oacute;n de los cuadros de entrada en porciones de video llamadas rebanadas de video, y la segunda, en la segmentaci&oacute;n de objetos de video para que el usuario pueda interactuar con ellos o, simplemente para codificar cada objeto por separado (ISO/IEC JTCI/SC29/WG11, 2000). Este est&aacute;ndar consta de varios perfiles que manejan diferentes velocidades binarias compatibles con diferentes aplicaciones. A la par del surgimiento del MPEG&#150;4 parte 2, y para obtener mayor compresi&oacute;n que en el H.261, la ITU&#150;T desarroll&oacute; el est&aacute;ndar H.263 para aplicaci&oacute;n en video tel&eacute;fonos y compatible con el MPEG&#150;4 parte 2 perfil avanzado.</font></p>     <p align="justify"><font face="verdana" size="2">El grupo de expertos de la ITU&#150;T y el grupo de expertos de la ISO/IEC, se unieron para conformar el equipo conjunto de video (JVT, <i>Joint Video Team) y </i>trabajar en el desarrollo de un nuevo est&aacute;ndar, con un mejor desempe&ntilde;o, tanto en la calidad de video como en la eficiencia de codificaci&oacute;n. El nombre del nuevo est&aacute;ndar es el H.264 o MPEG&#150;4 parte 10 (ITU&#150;T H.264, 2003) y cuenta adem&aacute;s con  especificaciones simples de su sintaxis, lo cual proporciona una mejor integraci&oacute;n con todos los protocolos actuales y arquitecturas m&uacute;ltiples. Esto permite incluir otras aplicaciones, tales como la transmisi&oacute;n de video y video conferencia en redes fijas e inal&aacute;mbricas y en diferentes protocolos de transporte.</font></p>     <p align="justify"><font face="verdana" size="2">El grupo de expertos de la ITU&#150;T y el grupo de expertos de la ISO/IEC, se unieron para conformar el equipo conjunto de video (JVT, <i>Joint Video Team) y </i>trabajar en el desarrollo de un nuevo est&aacute;ndar, con un mejor desempe&ntilde;o, tanto en la calidad de video como en la eficiencia de codificaci&oacute;n.  El nombre del nuevo est&aacute;ndar es el H.264 o MPEG&#150;4 parte 10 (ITU&#150;T H.264, 2003) y cuenta adem&aacute;s con especificaciones simples de su sintaxis, lo cual proporciona una mejor integraci&oacute;n con todos los protocolos actuales y arquitecturas m&uacute;ltiples. Esto permite incluir otras aplicaciones tales como la transmisi&oacute;n de video y video conferencia en redes fijas e inal&aacute;mbricas y en diferentes protocolos de transporte.</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 cuenta con los mismos elementos o bloques funcionales que sus antecesores, ya que tambi&eacute;n adopta un algoritmo hibrido de predicci&oacute;n y transformaci&oacute;n para la reducci&oacute;n de la correlaci&oacute;n espacial y de la se&ntilde;al residual, control de la velocidad binaria o <i>bit rate, </i>predicci&oacute;n por compensaci&oacute;n de movimiento para reducir la redundancia temporal, as&iacute; como la codificaci&oacute;n de la entrop&iacute;a para reducir la correlaci&oacute;n estad&iacute;stica. Sin embargo, lo que hace que este est&aacute;ndar proporcione mayor eficiencia de codificaci&oacute;n, es la manera en que opera cada bloque funcional. Por ejemplo, el H.264 incluye predicci&oacute;n intra cuadro (INTRA), caracter&iacute;stica &uacute;nica de este est&aacute;ndar (Huang, 2005); transformaci&oacute;n por bloques de 4x4 muestras, cuyos coeficientes transformados resultan enteros (Wien, 2003), anteriormente, se inclu&iacute;a transformaci&oacute;n de 8x8 muestras, referencia m&uacute;ltiple para predicci&oacute;n temporal, tama&ntilde;o variable de los macrobloques a comprimir, precisi&oacute;n de un cuarto de p&iacute;xel para la compensaci&oacute;n de movimiento, filtro de desbloqueo (List, 2993), codificador de entrop&iacute;a mejorado. Todas estas mejoras vienen acompa&ntilde;adas de un aumento en la complejidad de la implementaci&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">Los canales inal&aacute;mbricos suelen agregar mucho ruido a la se&ntilde;al original y no se puede llevar a cabo la recepci&oacute;n perfecta de la misma; cualquier error en la decodificaci&oacute;n de un bit puede propagarse a bloques subsecuentes o incluso a cuadros subsecuentes, degradando la calidad subjetiva de la imagen. El H.264 utiliza m&eacute;todos para incrementar la resistencia a errores. Por ejemplo, utiliza el ordenamiento flexible de macrobloques (FMO), la transmisi&oacute;n de rebanadas redundantes de cuadros de video e incluye el particionamiento de datos, que tambi&eacute;n es utilizado en los est&aacute;ndares previos.</font></p>     <p align="justify"><font face="verdana" size="2">En el H.264, al igual que en sus antecesores, se definen diferentes perfiles y niveles dentro de cada uno, los cuales especifican restricciones en el tren de bits o <i>bitstream. </i>Cada perfil especifica un conjunto de caracter&iacute;sticas y los l&iacute;mites del decodificador, aunque los codificadores no requieren de ning&uacute;n conjunto particular de caracter&iacute;sticas de un perfil. Los niveles especifican los l&iacute;mites de los valores que deben tomar los elementos de la sintaxis de la recomendaci&oacute;n o est&aacute;ndar. En cada perfil se utiliza la misma definici&oacute;n de niveles, pero las aplicaciones individuales s&oacute;lo pueden utilizar un nivel diferente en cada uno. Por lo general, la carga de procesamiento del decodificador y la capacidad de memoria para un perfil dado se desprende de los diferentes niveles.</font></p>     <p align="justify"><font face="verdana" size="2">En la primera versi&oacute;n del H.264 existen tres perfiles, el l&iacute;nea base o <i>baseline, </i>el principal o <i>main </i>y el extendido o <i>extended. </i>El perfil l&iacute;nea base se aplica a los servicios de conversaci&oacute;n en tiempo real, como video conferencia y video tel&eacute;fono. El perfil principal es para aplicaciones de almacenamiento digital de video y datos, as&iacute; como de transmisi&oacute;n de televisi&oacute;n. El perfil extendido es aplicable tambi&eacute;n a servicios de multimedia en Internet. La <a href="/img/revistas/iit/v8n3/a4f1.jpg" target="_blank">figura 1</a> muestra la relaci&oacute;n que existe entre estos perfiles. La &uacute;ltima versi&oacute;n del H.264, define cuatro perfiles altos o superiores, detallados como extensiones del rango de fidelidad <i>(fidelity range extensions) </i>para aplicaciones de distribuci&oacute;n de contenido (Sullivan, 2004), as&iacute; como para edici&oacute;n y post procesamiento <i>(High, High 10, High 4:2:2 y High 4:4:4</i>). El perfil alto, se desarroll&oacute; para procesar video de 8 bits con formato de muestreo de la crominancia de 4:2:0 y para aplicaciones que utilizan alta resoluci&oacute;n. El perfil <i>high 10, </i>se desarroll&oacute; para procesar video de hasta 10 bits con formato de muestreo 4:2:0 de los cuadros de entrada, para aplicaciones que utilizan alta resoluci&oacute;n y mayor exactitud. El perfil <i>high 4:2:2, </i>soporta el formato de muestreo de los cuadros de crominancia de 4:2:2 y hasta 10 bits por muestra de exactitud. El perfil 4:4:4 soporta el formato de muestreo de los cuadros de crominancia 4:4:4 y hasta 12 bits por muestra de exactitud, as&iacute; como transformaci&oacute;n residual entera de los cuadros de color para codificar se&ntilde;ales RGB. Las relaciones entre perfiles se describen a continuaci&oacute;n:</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>Partes comunes a todos los perfiles</i></font></p>     ]]></body>
<body><![CDATA[<blockquote>       <p align="justify"><font face="verdana" size="2">&#150; Rebanadas tipo I (Rebanadas codificadas utilizando predicci&oacute;n INTRA): Rebanada codificada utilizando la predicci&oacute;n de las muestras decodificadas dentro de la misma rebanada.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Rebanadas tipo P (Rebanadas codificadas utilizando codificaci&oacute;n predictiva en un solo sentido): Rebanada codificada utilizando predicci&oacute;n inter cuadro (INTER). Se utilizan como referencia los cuadros previamente decodificados con un vector de movimiento y un &iacute;ndice de referencia para predecir los valores de las muestras de cada bloque.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Utiliza el codificador CAVLC <i>(Con</i><i>text&#150;based Adaptive  Variable Length Co</i><i>ding) </i>para la codificaci&oacute;n de la entrop&iacute;a.</font></p>       <p align="justify"><font face="verdana" size="2">&nbsp;</font></p> </blockquote>     <p align="justify"><font face="verdana" size="2"><i>Perfil l&iacute;nea base (Baseline)</i></font></p>     <blockquote>       <p align="justify"><font face="verdana" size="2"><i>&#150; </i>Ordenamiento flexible de macrobloques: Los macrobloques no necesariamente se ordenan horizontalmente y de izquierda a derecha <i>(raster scan). </i>Existe un mapa que asigna los macrobloques a un determinado grupo de rebanadas.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Ordenamiento arbitrario de rebanadas: La direcci&oacute;n del primer macrobloque de una rebanada puede ser menor que la direcci&oacute;n del primer macrobloque de alguna rebanada anterior dentro del mismo cuadro codificado.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Rebanada redundante: Esta rebanada pertenece a datos redundantes ya codificados con igual o diferente velocidad binaria en comparaci&oacute;n con los mismos datos codificados pertenecientes a la misma rebanada.</font></p> </blockquote>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>Perfil principal (Main)</i></font></p>     <blockquote>       <p align="justify"><font face="verdana" size="2">&#150; Rebanadas tipo B (Rebanadas codificadas utilizando codificaci&oacute;n predictiva bidireccional): Rebanada codificada utilizando predicci&oacute;n INTER con referencia de un cuadro previamente decodificado y utilizando a lo m&aacute;s, dos vectores de movimiento e &iacute;ndices de referencia para predecir los valores de las muestras de cada bloque.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Predicci&oacute;n con peso: Esta es una operaci&oacute;n de escalamiento, en la cual se aplica un factor de peso a las muestras resultantes de la compensaci&oacute;n de movimiento en rebanadas tipo P o B.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Utiliza el codificador CABAC <i>(Context&#150;based Adaptive Binary Arithmetic Coding) </i>para codificaci&oacute;n de la entrop&iacute;a.</font></p> </blockquote>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>Perfil extendido</i></font></p>     <blockquote>       <p align="justify"><font face="verdana" size="2">&#150; Se incluyen todas las partes del perfil l&iacute;nea base.</font></p>       ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&#150; Rebanadas tipo SP: Es un tipo de rebanada especial, codificada para cambiar eficientemente de resoluciones entre tramas de video (escalabilidad &#150; capa de bits b&aacute;sicos + capa de ensanchamiento), es similar a la codificaci&oacute;n de una rebanada tipo P.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Rebanadas tipo SI: Igual que el anterior, pero es similar a codificar una rebanada tipo I.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Particionamiento de datos: Los datos codificados se colocan en particiones separadas en capas diferentes. Se utiliza para reducir errores durante la transmisi&oacute;n y para el empaquetamiento efectivo de los datos.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Rebanadas tipo B: Se utiliza para predicci&oacute;n bidireccional, incrementa la calidad del video y la velocidad binaria.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Predicci&oacute;n con peso.</font></p>       <p align="justify"><font face="verdana" size="2">&nbsp;</font></p> </blockquote>     <p align="justify"><font face="verdana" size="2"><i>Perfil alto (High)</i></font></p>     <blockquote>       <p align="justify"><font face="verdana" size="2"><i>&#150; </i>Incluye todas las partes del perfil principal <i>(Main).</i></font></p>       <p align="justify"><font face="verdana" size="2"><i>&#150; </i>Transformaci&oacute;n por bloques de tama&ntilde;o adoptivo: DCT de 4x4 y transformaci&oacute;n DCT entera para los bloques de luminancia. El tama&ntilde;o del bloque a codificar dentro de un macrobloque puede ser diferente.</font></p>       ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&#150; Matrices de cuantizaci&oacute;n escaladas: Se utilizan diferentes escalas de acuerdo con frecuencias espec&iacute;ficas asociadas con los coeficientes transformados para optimizar la calidad subjetiva del video.</font></p> </blockquote>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4t1.jpg" target="_blank">tabla 1</a> lista a los perfiles del H.264 y del MPEG&#150;4 parte 2 (video), as&iacute; como los requerimientos m&aacute;s importantes para cada aplicaci&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">Los niveles de cada perfil se muestran en la <a href="/img/revistas/iit/v8n3/a4t2.jpg" target="_blank">tabla 2</a>. Cada nivel soporta diferentes tama&ntilde;os de los cuadros de entrada ( <i>QCIF, CIF, ITU&#150;R 601 (SDTV), HDTV, </i>S&#150;HDTV, Cinema digital (Richardson, 2003)). Cada nivel ajusta los l&iacute;mites de las velocidades binarias, tama&ntilde;o de la memoria para almacenar cuadros de referencia, etc. La <a href="/img/revistas/iit/v8n3/a4t3.jpg" target="_blank">tabla 3</a> muestra los par&aacute;metros l&iacute;mite de cada nivel.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Estructura de las capas del H.264</b></font></p>     <p align="justify"><font face="verdana" size="2">El H.264 se compone de dos capas, la capa de la red de abstracci&oacute;n (NAL, <i>Network Abstraction Layer) </i>y la capa de codificaci&oacute;n del video (VCL, <i>Video Coding Layer). </i>NAL abstrae los datos para hacer compatible al tren de bits de salida del codificador con casi todos los canales de comunicaci&oacute;n o medios de almacenamiento. Esta unidad de red, especifica los datos en un formato de bytes <i>(byte&#150;stream) </i>o de paquetes. El formato de bytes define patrones de bytes o de bits utilizados en el est&aacute;ndar H.320 o en el MPEG&#150;2. El formato de paquetes, define paquetes de datos identificables por protocolos de transporte para aplicaciones de RTP/UDP/IP (Wenger, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">La capa VCL constituye el n&uacute;cleo de los datos codificados. &Eacute;sta consiste en la secuencia de video a codificar, cuadros o campos dentro de la secuencia de video con tres arreglos de muestras (luminancia, crominancia o RGB), rebanadas dentro de cada cuadro   y   macrobloques   dentro   de   cada rebanada, as&iacute; como bloques dentro de cada macrobloque. Tambi&eacute;n, el H.264 soporta b&uacute;squeda (escaneo) progresiva y entrelazada, la cual puede mezclarse dentro de la misma secuencia. El perfil l&iacute;nea base se limita &uacute;nicamente a b&uacute;squeda progresiva. Los cuadros se dividen en rebanadas.   Una  rebanada  de video es una secuencia de macrobloques que pueden  tener  distintos  tama&ntilde;os   (tama&ntilde;os flexibles). En el caso de grupos de rebanadas, la posici&oacute;n de un macrobloque se determina por medio de un mapa que representa al grupo de rebanadas. El mapa indica a cu&aacute;l grupo de rebanadas pertenece el macrobloque (Ghanbari, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Algoritmo de codificacion de video</b></font></p>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4f2.jpg" target="_blank">figura 2</a> muestra el diagrama a bloques del algoritmo de codificaci&oacute;n del H.264. El codificador debe seleccionar entre codificaci&oacute;n INTRA o INTER. En codificaci&oacute;n INTRA se utilizan varios modos de predicci&oacute;n para reducir la redundancia espacial de un solo cuadro. La codificaci&oacute;n INTER es m&aacute;s eficiente y se utiliza en la codificaci&oacute;n tipo P o B (predictiva o bidireccional) de cada bloque de muestras. En esta codificaci&oacute;n se utilizan como referencia los cuadros decodificados previamente. La codificaci&oacute;n INTER utiliza vectores de movimiento para reducir la redundancia temporal entre cuadros. La predicci&oacute;n se obtiene despu&eacute;s de filtrar el bloque anterior reconstruido. El filtro reduce los artefactos o distorsiones introducidos en las orillas de un bloque, debido a la cuantizaci&oacute;n. Los vectores de movimiento y el modo de predicci&oacute;n INTRA pueden tener varias especificaciones, dependiendo del tama&ntilde;o de los bloques a codificar. Antes de ser cuantizado, el error o predicci&oacute;n residual se comprime a&uacute;n m&aacute;s utilizando una transformada, la cual remueve la correlaci&oacute;n espacial del bloque. Finalmente, los vectores de movimiento y los coeficientes cuantizados se codifican utilizando codificadores de entrop&iacute;a tales como el CAVLC <i>(Context&#150;Adaptive Variable Length Codes) </i>o el CAB AC <i>(Context&#150;Adaptive Binary Arithmetic Codes) </i>(Marpe, 2003).</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Predicci&oacute;n intracuadro (modo INTRA)</b></font></p>     <p align="justify"><font face="verdana" size="2">Los est&aacute;ndares anteriores llevan a cabo la predicci&oacute;n INTRA, codificando independientemente cada macrobloque (MB), como si se tratara de la codificaci&oacute;n de una imagen (Ochoa, 2006), ya que se necesita que tengan la menor distorsi&oacute;n posible para que sirvan de referencia a la codificaci&oacute;n INTER. La codificaci&oacute;n INTRA, tambi&eacute;n se aplica dentro de rebanadas codificadas en modo INTRA o en macrobloques que contienen una correcci&oacute;n temporal inaceptable, aunque se haya utilizando compensaci&oacute;n de movimiento (macrobloques INTER con una distorsi&oacute;n por encima de un nivel de referencia espec&iacute;fico). Este efecto provoca que se incremente el n&uacute;mero de bits en el modo INTRA, haciendo imposible reducir la velocidad binaria.</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 utiliza el concepto de predicci&oacute;n INTRA para codificar bloques o macrobloques de referencia y reducir la cantidad de bits codificados. Para codificar un bloque o macrobloque en modo INTRA, se forma un bloque de predicci&oacute;n basado en un bloque reconstruido previamente dentro del mismo cuadro y sin filtrar. Posteriormente, se codifica la se&ntilde;al residual (error) entre el bloque actual y la predicci&oacute;n, disminuyendo considerablemente la cantidad de bits que representan al bloque actual. El bloque de luminancia bajo predicci&oacute;n, puede formarse por subbloques de 4x4 muestras o por todo el bloque de 16x16 muestras. Para cada bloque de luminancia de 4x4, se selecciona un modo de predicci&oacute;n de nueve modos existentes. Existen cuatro modos de predicci&oacute;n para bloques de luminancia de 16x16 muestras. Solo existe un modo de predicci&oacute;n para cada bloque de crominancia de 4x4 muestras.</font></p>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4f3.jpg" target="_blank">figura 3</a> muestra la predicci&oacute;n de un bloque de luminancia de 4x4 muestras. &#91;a, b, ..., p&#93; son las muestras bajo predicci&oacute;n del bloque actual y &#91;A, B, ..., M&#93; las muestras del bloque previamente reconstruido. Las muestras se utilizan de acuerdo con las direcciones de predicci&oacute;n de cada modo, las flechas indican la direcci&oacute;n de predicci&oacute;n (ITU&#150;T H.264, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">En el modo 0 (vertical) y el modo 1 (horizontal), las muestras predecidas se forman por extrapolaci&oacute;n de las muestras superiores &#91;A, B, C, D&#93; y de las muestras de la izquierda &#91;I, J, K, L&#93; respectivamente. En el modo 2 (DC), todas las muestras predecidas se forman por medio de las muestras &#91;A, B, C, D, I, J, K, L&#93;. En el modo 3 (diagonal izquierda y hacia abajo), modo 4 (diagonal derecha hacia abajo), modo 5 (vertical derecha), modo 6 (horizontal hacia abajo), modo 7 (vertical izquierda) y modo 8 (horizontal hacia arriba), las muestras predecidas se forman dando cierto peso al promedio de las muestras A&#150;M. Por ejemplo, las muestras 'a' y 'd' son predecidas redondeando el resultado round(I/4 + M/2 + A/4) y round(B/4 + C/2 + D/4) en el modo 4. Tambi&eacute;n, por medio de round(I/2 + J/2) y round(J/4 + K/2 + L/4) en el modo 8. El modo seleccionado por el codificador ser&aacute; aquel que minimice el error o residuo entre el bloque a codificar y su predicci&oacute;n (ITU&#150;T H.264, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">Existen   &uacute;nicamente   4   modos   para   la predicci&oacute;n de los componentes de luma de un bloque de 16x16. Para los modos 0 (vertical), 1 (horizontal) y 2 (DC) las predicciones son similares a los casos de 4x4. Para el modo 4 (plano), se utiliza una funci&oacute;n lineal que se ajusta a las muestras superior e izquierda.</font></p>     <p align="justify"><font face="verdana" size="2">Cada bloque de 8x8 muestras de la componente de crominancia, en un macrobloque, se predice de las muestras de los bloques superior o izquierdo previamente codificados y reconstruidos. Los cuatro modos de predicci&oacute;n son similares a los modos de predicci&oacute;n de los bloques de 16x6 de lu&#150;minancia, excepto que el orden de los modos es diferente, modo 0 (DC), modo 1 (horizontal), modo 2 (vertical) y modo 3 (plano).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Predicci&oacute;n intercuadro (modo INTER)</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">La predicci&oacute;n INTER, la estimaci&oacute;n del movimiento y la compensaci&oacute;n del movimiento son tres factores que ayudan a reducir la redundancia o correlaci&oacute;n temporal. En el H.264, el cuadro actual puede particionarse en macrobloques o bloques m&aacute;s peque&ntilde;os. La compensaci&oacute;n de movimiento realizada con bloques m&aacute;s peque&ntilde;os, incrementa la ganancia de la codificaci&oacute;n, a costa de incrementar el n&uacute;mero de datos necesarios para representar la compensaci&oacute;n. En el proceso de codificaci&oacute;n INTER, se pueden procesar bloques de hasta 4x4 muestras de luminancia, utilizando una exactitud en los vectores de movimiento de hasta un cuarto de muestra. El proceso de predicci&oacute;n INTER de un bloque, involucra la selecci&oacute;n de cuadros reconstruidos previamente, los cuales est&aacute;n almacenados en la memoria del sistema. Los vectores de movimientos se codifican utilizando una t&eacute;cnica diferencial. A diferencia de otros est&aacute;ndares, en el H.264 las rebanadas codificadas bidireccionalmente se pueden utilizar como referencia para la codificaci&oacute;n INTER de otros cuadros (ITU&#150;T H.264, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Predicci&oacute;n en tama&ntilde;os variables de bloques</b></font></p>     <p align="justify"><font face="verdana" size="2">Un macrobloque de luminancia de 16x16 muestras, puede dividirse en peque&ntilde;os bloques de hasta 4x4, como se muestra en la <a href="/img/revistas/iit/v8n3/a4f4.jpg" target="_blank">figura 4</a>. Existen cuatro casos: 16x16, 16,8, 8x16 y 8x8 para los macrobloques de 16x16. Tambi&eacute;n existen cuatro casos para un macrobloque de luminancia de 8x8: 8x8, 8x4, 4x8, 4x4. Entre m&aacute;s peque&ntilde;o sea el bloque bajo predicci&oacute;n, mayor ser&aacute; el n&uacute;mero de bits para representar los vectores de movimiento y otros datos tales como el tipo de partici&oacute;n; sin embargo, si se utilizan particiones peque&ntilde;as se puede reducir considerablemente el error o residuo resultante de la compensaci&oacute;n de movimiento. La selecci&oacute;n del tama&ntilde;o de la partici&oacute;n depende de las caracter&iacute;sticas del video de entrada. En general, una partici&oacute;n grande es beneficiosa cuando las muestras del bloque son homog&eacute;neas y una partici&oacute;n peque&ntilde;a cuando no existe homogeneidad (detalles) (Wien, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Interpolaci&oacute;n para la predicci&oacute;n fraccional o sub muestra (Sub&#150;pel, <i>Sub Picture Element)</i></b></font></p>     <p align="justify"><font face="verdana" size="2">La predicci&oacute;n en modo INTER de cada partici&oacute;n de un macrobloque codificado, se lleva a cabo en un &aacute;rea del mismo tama&ntilde;o del cuadro de referencia. En este caso, la compensaci&oacute;n de movimiento se hace con respecto a muestras enteras. En ocasiones, el movimiento no se lleva a cabo en muestras enteras sino fraccionales, por lo que hay que interpolar el &aacute;rea de referencia. El desplazamiento u <i>offset </i>entre las dos &aacute;reas (vectores de movimiento) tiene una resoluci&oacute;n en fraccional (sub muestras), tanto para la luminancia como para la crominancia <a href="/img/revistas/iit/v8n3/a4f5.jpg" target="_blank">(Figura 5)</a>. Si el proceso de interpolaci&oacute;n elegido incrementa la resoluci&oacute;n del &aacute;rea de referencia (&aacute;rea de b&uacute;squeda) al doble, se dice que se tiene una compensaci&oacute;n de movimiento con exactitud de 1/2 muestra, y si se aumenta cuatro veces, se dice que se tiene una compensaci&oacute;n de movimiento con exactitud de 1/4 de muestra. En el H.264 la compensaci&oacute;n de movimiento puede realizarse con una exactitud de hasta 1/4 de muestra (ITU&#150;T H.264, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">La compensaci&oacute;n de movimiento fraccional (1/2, 1/4) resulta en una mayor compresi&oacute;n y mejor calidad de la imagen que la compensaci&oacute;n de movimiento entera, a expensas del incremento de la complejidad en el codificador. En aplicaciones para velocidades binarias altas, as&iacute; como altas resoluciones, se ha comprobado que la predicci&oacute;n fraccional de 1/4 de muestra es mucho m&aacute;s eficiente que la de 1/2 muestra, en cuanto a compresi&oacute;n y calidad de la imagen se refiere.</font></p>     <p align="justify"><font face="verdana" size="2">En las muestras de luminancia, la exactitud de 1/2 muestra se genera filtrando las muestras vecinas con un filtro FIR, cuyos coeficientes son (1, &#150;5, 20, 20, &#150;5, 1)/32. Esto significa que cada muestra intermedia se obtiene de la suma de 6 muestras vecinas enteras, cada muestra con su correspondiente peso. Por ejemplo, en la <a href="/img/revistas/iit/v8n3/a4f6.jpg" target="_blank">figura 6</a>, la muestra intermedia 'b' se calcula de la muestras E, F, G, H, I y J utilizando la formula 1.</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e1.jpg">............................................(1)</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Similarmente,   la  muestra  h   se   puede calcular de las muestras verticales A, C, G, M, R y T. Una vez calculadas las muestras con exactitud de 1/2 <i>, </i>se calculan las muestras con exactitud de 1/4 por medio de interpolaci&oacute;n bilineal entre muestras de exactitud entera y de 1/2 <i>. </i>Por ejemplo, la muestra 'a', con exactitud de 1/4 de muestra, se puede calcular de la muestra entera G, la muestra 'b' con exactitud 1/2 <i>, </i>se calcula utilizando la ecuaci&oacute;n 2.</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e2.jpg">............................................................................(2)</font></p>     <p align="justify"><font face="verdana" size="2">En el caso del formato de video 4:2:0, se requiere una exactitud de 1/8 de muestra en las componentes de crominancia (correspondientes a 1/4 de muestra en luminancia).  Las muestras a 1/8 de exactitud se interpolan utilizando interpolaci&oacute;n bilineal entre muestras enteras de los cuadros de crominancia (ITU&#150;T H.264, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Filtro de desbloqueo (remueve la distorsi&oacute;n debida a la cuantizaci&oacute;n en los bordes de los bloques)</b></font></p>     <p align="justify"><font face="verdana" size="2">El proceso de codificaci&oacute;n involucra macro&#150;bloques con distintas caracter&iacute;sticas, algunos con mayor correlaci&oacute;n que otros. Para mantener una cierta velocidad binaria, los bloques INTRA o INTER se cuantizan utilizando diferentes cuantizadores, los cuales introducen distorsi&oacute;n o artefactos indeseables alrededor de los bloques reconstruidos. En est&aacute;ndares anteriores, el filtro de desbloqueo era s&oacute;lo una recomendaci&oacute;n (opcional) del est&aacute;ndar, en el H.264, el filtro de desbloqueo es parte obligatoria del mismo. El filtro utilizado en el H.264 reduce la distorsi&oacute;n en los bordes del bloque y evita que el ruido acumulado debido  a  la  codificaci&oacute;n  se  propague.   El MPEG&#150;1   y MPEG&#150;2 no utilizan este  filtro, debido a la complejidad de su implementaci&oacute;n. Por otra parte, la distorsi&oacute;n en estos est&aacute;ndares se reduce utilizando compensaci&oacute;n de movimiento con exactitud de 1/2 muestra.</font></p>     <p align="justify"><font face="verdana" size="2">En el H.264, el filtrado se aplica a los bordes de bloques de 4x4 muestras de un macrobloque como se muestra en la <a href="/img/revistas/iit/v8n3/a4f7.jpg" target="_blank">figura 7</a>. El filtro procesa por separado los bloques de luminancia y crominancia. El proceso de filtrado para bloques de luminancia se lleva a cabo en cuatro bordes de 16 muestras cada uno y el proceso de filtrado de luma en dos bordes de 8 muestras. La <a href="/img/revistas/iit/v8n3/a4f7.jpg" target="_blank">figura 7(a)</a> muestra el proceso de filtrado horizontal (afecta bordes verticales) y la <a href="/img/revistas/iit/v8n3/a4f7.jpg" target="_blank">figura 7(b)</a> el proceso de filtrado vertical (afecta bordes horizontales).</font></p>     <p align="justify"><font face="verdana" size="2">El filtro se aplica adaptivamente en viarios niveles:</font></p>     <blockquote>       <p align="justify"><font face="verdana" size="2">&#150; A nivel rebanada: El filtrado se puede ajustar a las caracter&iacute;sticas individuales de la secuencia de video.</font></p>       ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&#150; A nivel de borde de bloque: El filtrado se vuelve independiente de la decisi&oacute;n INTRA/INTER de las diferencias de movimiento y de la presencia de residuos codificados en los dos bloques participantes en el filtrado.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; A nivel muestra: El efecto de filtrado se puede anular dependiendo de los valores de las muestras y de los umbrales del cuantizador.</font></p> </blockquote>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Transformaci&oacute;n y cuantizaci&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2">El H.264 se basa en la codificaci&oacute;n de macro&#150;bloques, utiliza transformadas para remover la redundancia espacial (Ochoa, 2006). Los cuadros de entrada al codificador, as&iacute; como los residuos, resultado de la predicci&oacute;n, contienen una correlaci&oacute;n o redundancia espacial alta. Despu&eacute;s de la predicci&oacute;n INTER cuadro, o predicci&oacute;n espacial basada en las muestras de cuadros previamente decodificados con respecto al cuadro actual (bajo predicci&oacute;n), el residuo o predicci&oacute;n resultante se divide en bloques de 4x4 u 8x8 muestras, los cuales se convierten al domino de la frecuencia y los coeficientes resultantes se cuantizan.</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 utiliza una transformada de tama&ntilde;o adaptivo de 4x4 y de 8x8 (perfiles altos); los est&aacute;ndares anteriores utilizaban &uacute;nicamente la transformada DCT de 8x8. Una transformada de 4x4 es mucho menos compleja, ya que necesita menos multiplicaciones para llevar a cabo una transformaci&oacute;n. Tambi&eacute;n, si el codificador decide procesar un bloque de menor tama&ntilde;o, las distorsiones en los bordes del mismo bloqueo se reduce significativamente.</font></p>     <p align="justify"><font face="verdana" size="2">Para mejorar la eficiencia de la compresi&oacute;n, el H.264 emplea una estructura de transformaci&oacute;n jer&aacute;rquica, esto es, los coeficientes de DC de bloques vecinos de 4x4 de luminancia se agrupan en bloques de 4x4 y se aplica de nuevo la transformada Hadamard.</font></p>     <p align="justify"><font face="verdana" size="2">Existe una alta correlaci&oacute;n entre coeficientes transformados de DC de bloques vecinos, cuyas muestras son muy similares. Por lo tanto, el est&aacute;ndar especifica la transformada Hadamard para los coeficientes de DC de bloques transformados de luma de 16x16, y la transformada Hadamard de 2x2 para los coeficientes de DC de bloques transformados de crominancia.</font></p>     <p align="justify"><font face="verdana" size="2">En algunas aplicaciones se requiere reducir el tama&ntilde;o de los pasos de los cuantizadores para aumentar la relaci&oacute;n se&ntilde;al a ruido pico (PSNR, <i>Peak Signal to Noise Ratio) </i>a niveles que se consideran visualmente sin p&eacute;rdidas. Para logra esto, el H.264 extiende el rango de los pasos de cuantizaci&oacute;n (QP) en dos octavas, teniendo que redefinir las tablas de cuantizaci&oacute;n y permitiendo que QP pueda variar de 0 a 51.</font></p>     <p align="justify"><font face="verdana" size="2">En general, la transformaci&oacute;n y la cuantizaci&oacute;n requieren de varias multiplicaciones, esto eleva la complejidad de su implementaci&oacute;n. Por lo tanto, para lograr una implementaci&oacute;n m&aacute;s simple, el proceso de transformaci&oacute;n exacta se modifica para reducir el n&uacute;mero de multiplicaciones, resultando en una transformada entera, la cual integra en proceso de transformaci&oacute;n, cuantizaci&oacute;n y escalamiento. Este proceso se llama trasformaci&oacute;n entera con post escalamiento</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">A continuaci&oacute;n se describen los pasos para lograr la transformada directa DCT entera, post&#150;escalamiento, as&iacute; como la transformada inversa.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Proceso de codificaci&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2"><i>Paso 1.  Transformada entera directa</i></font></p>     <p align="justify"><font face="verdana" size="2">Para la transformaci&oacute;n DCT exacta de un bloque de luminancia <i>F </i>de 4x4, utilizamos</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e3.jpg">............................................................................................(3)</font></p>     <p align="justify"><font face="verdana" size="2">Donde <i>H </i>es la siguiente matriz</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e4.jpg">........................................................................(4)</font></p>     <p align="justify"><font face="verdana" size="2">Las variables <i>a, b, c y d </i>tienen los siguientes valores.</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e5.jpg">................................................(5)</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>A </i>fin de facilitar la implementaci&oacute;n de (5), c se aproxima a 0.5 y b se modifica para asegurar ortogonalidad, quedando como sigue:</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e6.jpg">.........................................................................(6)</font></p>     <p align="justify"><font face="verdana" size="2">Se pueden evitar algunas multiplicaciones en el proceso de transformaci&oacute;n integrando el proceso de cuantizaci&oacute;n. Por lo tanto, la ecuaci&oacute;n (1) se puede modificar antes de cuantizar de la siguiente forma:</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e7.jpg">...................................................................................(7)</font></p>     <p align="justify"><font face="verdana" size="2">donde</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e8.jpg">.......................................................................(8)</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e9.jpg">......................................................(9)</font></p>     <p align="justify"><font face="verdana" size="2">El s&iacute;mbolo <img src="/img/revistas/iit/v8n3/a4s1.jpg"> denota multiplicaci&oacute;n elemento por elemento de las matrices correspondientes.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>Paso 2. Post escalamiento y cuantizaci&oacute;n </i></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>A </i>la matriz <i>SF </i>se le aplica una cuantizaci&oacute;n, utilizando un cuantizador <i>(<i>Q<sub>step</sub></i>), </i>para despu&eacute;s obtener una nueva matriz Y de la siguiente forma:</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e10.jpg">..........................................................................(10)</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 define un total de 52 valores para <i>Q<sub>step</sub></i></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Proceso de decodificaci&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2"><i>Paso 1. Cuantizaci&oacute;n inversa y preescalamiento</i></font></p>     <p align="justify"><font face="verdana" size="2">La se&ntilde;al <i>Y</i> recibida en el decodificador se escala utilizando el valor de <i><i>Q<sub>step</sub></i>  y </i>se utiliza <i>SF<sup>&#150;1</sup> </i>como parte de la cuantizaci&oacute;n y transformaci&oacute;n inversas de la siguiente forma:</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e11.jpg">............................................................................(11)</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>Paso 2. Transformaci&oacute;n inversa entera</i></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Recuperamos la se&ntilde;al <i>F' </i>de la siguiente forma:</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e12.jpg">.......................................................................................(12)</font></p>     <p align="justify"><font face="verdana" size="2">Donde la matriz de transformaci&oacute;n inversa es:</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e13.jpg">.......................................................(13)</font></p>     <p align="justify"><font face="verdana" size="2">Posteriormente se aplica a bloques de 4x4 de coeficientes de DC de luminancia la transformada Hadamard de la ecuaci&oacute;n 12. Esto constituye una transformaci&oacute;n jer&aacute;rquica.</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e14.jpg">.........................................................................(14)</font></p>     <p align="justify"><font face="verdana" size="2">A los coeficientes de DC de los bloques de crominancia (formato 4:2:0), se les aplica la siguiente transformada.</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e15.jpg">........................................................................................(15)</font></p>     <p align="justify"><font face="verdana" size="2">Para los coeficientes de DC de los bloques de crominancia en los formatos 4:2:2 y 4:4:4 tambi&eacute;n se utiliza la transformada Hadamard adaptada.</font></p>     <p align="justify"><font face="verdana" size="2">La siguiente matriz de la DCT entera se utiliza &uacute;nicamente en perfiles altos.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e16.jpg">.....................................(16)</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Codificaci&oacute;n en entrop&iacute;a</b></font></p>     <p align="justify"><font face="verdana" size="2">En est&aacute;ndares anteriores (MPEG&#150;1, 2, 4, H.261 y H.263), la codificaci&oacute;n de la entrop&iacute;a se basa en tablas previamente definidas, las cuales contienen los c&oacute;digos de longitud variable (VLCs, <i>variable length code) </i>(Flierl, 2003), donde el conjunto de palabras de c&oacute;digo en las tablas se basa en distribuciones de probabilidad de datos obtenidos en secuencias de video gen&eacute;rico, en lugar de utilizar la codificaci&oacute;n Huffman o arim&eacute;tica exacta  para  la  codificar  la  secuencia  en cuesti&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 utiliza diferentes VLCs a fin de igualar el s&iacute;mbolo que representa un dato de video, con un c&oacute;digo basado en las caracter&iacute;sticas del contexto en el que se encuentra el s&iacute;mbolo. Todos los elementos de la sintaxis se codifican utilizando el c&oacute;digo Exp&#150;Golomb, excepto los datos residuales (Golomb, 1966). A fin de leer los datos residuales (coeficientes transformados y cuantizados) se utiliza una b&uacute;squeda en zigzag o una b&uacute;squeda alternada (campos de cuadros de video no entrelazados). Para codificar los datos residuales, se utiliza un m&eacute;todo m&aacute;s sofisticado llamado c&oacute;digo de longitud variable adaptivo basado en el contexto (CAVLC, <i>Context Based Adaptive Variable Length Code). </i>En los perfiles principal y alto, tambi&eacute;n se utiliza otro m&eacute;todo llamado CABAC, pero es m&aacute;s complejo que el CAVLC.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>C&oacute;digo adaptivo de longitud </b><b>variable basado en el contexto </b><b>(CAVLC)</b></font></p>     <p align="justify"><font face="verdana" size="2">Despu&eacute;s de la transformaci&oacute;n y la cuantizaci&oacute;n, la probabilidad de que el valor de un coeficiente sea cero o +/&#150;1 es muy alta. Por lo tanto, se codifica el n&uacute;mero total de ceros y +/&#150;1 que ocurren. Para los dem&aacute;s coeficientes s&oacute;lo se codifica su nivel.</font></p>     <p align="justify"><font face="verdana" size="2">Por ejemplo, suponiendo que los siguientes coeficientes se van a codificar utilizando CAVLC</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e16a.jpg"></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Las reglas que utilizar&iacute;a el CAVLC son:</font></p>     <blockquote>       <p align="justify"><font face="verdana" size="2">&#150; Paso 1: Se utiliza una palabra de c&oacute;digo de una tabla para expresar el n&uacute;mero  de  coeficientes  diferentes  de cero, 6  (orden 0,  1, 2, 4, 5,  7)     con magnitud uno, 3 (orden 4, 5, 7).</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Paso 2: Se forma una palabra de c&oacute;digo para indicar los signos de los unos en orden inverso de la siguiente forma, &#150;(orden 7), + (orden 5) y +(orden 4).</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Paso 3: Se utiliza una palabra de c&oacute;digo para cada nivel de los coeficientes restantes en orden inverso, esto es, una palabra de c&oacute;digo para c2 (orden 2), c1, y c0.</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Paso 4: Se utiliza una palabra de c&oacute;digo para indicar en n&uacute;mero de ceros, 2 (orden 3, 6)</font></p>       <p align="justify"><font face="verdana" size="2">&#150; Paso 5: Las palabras de c&oacute;digo resultantes se codifican utilizando runlength en orden inverso, esto es, una palabra de c&oacute;digo para 1 (orden 6&#150;5), 0 (orden 4), 1 (orden 3&#150;2).</font></p> </blockquote>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>C&oacute;digo aritm&eacute;tico binario adaptivo basado en el contexto (CABAC)</b></font></p>     <p align="justify"><font face="verdana" size="2">CABAC utiliza la codificaci&oacute;n aritm&eacute;tica a fin de obtener una buena compresi&oacute;n. El modelo de probabilidad se actualiza con cada s&iacute;mbolo como se muestra en la <a href="/img/revistas/iit/v8n3/a4f7.jpg" target="_blank">figura 7</a> (Marpe, 2003).</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>Paso 1. </i>Binarizaci&oacute;n. Proceso por el cual un s&iacute;mbolo no binario (coeficiente transformado, vector de movimiento, etc.) se mapea a una secuencia binaria &uacute;nica antes de aplicar la codificaci&oacute;n aritm&eacute;tica.</font></p>     <p align="justify"><font face="verdana" size="2"><i>Paso </i>2. Modelado del contexto. Un modelo de un contexto es un modelo de probabilidades para uno o m&aacute;s elementos de un s&iacute;mbolo binarizado. El modelo de probabilidad se selecciona de tal forma, que dicha selecci&oacute;n depende s&oacute;lo de elementos de la sintaxis previamente codificados.</font></p>     <p align="justify"><font face="verdana" size="2"><i>Paso 3. </i>Codificaci&oacute;n binaria aritm&eacute;tica. Se utiliza el c&oacute;digo aritm&eacute;tico para codificar cada elemento de acuerdo con la selecci&oacute;n del modelo de probabilidad.</font></p>     <p align="center"><font face="verdana" size="2"><a href="/img/revistas/iit/v8n3/a4f8.jpg" target="_blank">Figura 8. Diagrama a bloques del CABAC </a></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Rebanadas de video tipo B</b></font></p>     <p align="justify"><font face="verdana" size="2">La predicci&oacute;n bidireccional contribuye a reducir la correlaci&oacute;n temporal, ya que utiliza como referencia m&aacute;s cuadros almacenados en memoria. Los est&aacute;ndares que manejan cuadros tipo B, utilizan el modo bidireccional, lo cual s&oacute;lo permite la combinaci&oacute;n de una se&ntilde;al predecida previamente con la predicci&oacute;n subsiguiente. Una se&ntilde;al predecida, se forma por la se&ntilde;al subsiguiente, codificada como INTER, una se&ntilde;al perteneciente a un cuadro anterior y otra se&ntilde;al que se forma tomando el promedio lineal de dos se&ntilde;ales predecidas en donde se utiliza la compensaci&oacute;n de movimiento.</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 incluye no s&oacute;lo predicci&oacute;n hacia adelante/atr&aacute;s,  sino tambi&eacute;n la predicci&oacute;n adelante/adelante y atr&aacute;s/atr&aacute;s (Flierl, 2003). Se pueden utilizar dos cuadros anteriores para la predicci&oacute;n de una regi&oacute;n de video, justo antes de que la escena cambie y dos referencias posteriores justo despu&eacute;s de que la escena cambi&oacute;. A diferencia de los est&aacute;ndares previos, en el H.264, las rebanadas predecidas bidireccionalmente pueden utilizarse como referencia de otros cuadros que se codificar&aacute;n en modo INTER. Tambi&eacute;n, se agrega la predicci&oacute;n con peso cuando existen transiciones entre las diferentes escenas del video.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Predicci&oacute;n con peso</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Los est&aacute;ndares anteriores consideran con igual peso a todos los cuadros o im&aacute;genes que sirven como referencia para la predicci&oacute;n. Por ejemplo, una se&ntilde;al bajo predicci&oacute;n se obtiene promediando con igual peso las se&ntilde;ales de referencia. Sin embargo, la predicci&oacute;n de las se&ntilde;ales en transici&oacute;n gradual de escena a escena, precisa de diferentes pesos. La transici&oacute;n gradual es muy popular en cines, trancisiones de difuminadas hacia el color negro (las muestras de luminancia de la escena difuminan gradualmente aproxim&aacute;ndose a cero y las de crominancia se aproximan a 128) o desde el color negro.</font></p>     <p align="justify"><font face="verdana" size="2">El H.264 utiliza el m&eacute;todo de predicci&oacute;n con pesos para los macrobloques de una rebanada tipo <i>P </i>o tipo <i>B. </i>Una se&ntilde;al de predicci&oacute;n p para una rebanada tipo <i>B, </i>se obtiene de dos se&ntilde;ales de referencia <i>(r1 y r2) </i>utilizando diferentes pesos.</font></p>     <p align="justify"><font face="verdana" size="2"><img src="/img/revistas/iit/v8n3/a4e17.jpg">............................................................................(17)</font></p>     <p align="justify"><font face="verdana" size="2">Donde <i>w1 y w2 </i>son los pesos.</font></p>     <p align="justify"><font face="verdana" size="2">Los pesos se determinan en el codificador de dos maneras diferentes, impl&iacute;citamente y expl&iacute;citamente. En la determinaci&oacute;n impl&iacute;cita, los pesos los calcula el decodificador basado en la distancia temporal entre cuadros de referencia. Si la distancia temporal entre la referencia y el cuadro actual es cercana, los pesos son peque&ntilde;os, y si la distancia temporal  es   grande,   los  pesos   son  m&aacute;s grandes. En la determinaci&oacute;n explicita los pesos se env&iacute;an al decodificador en el encabezado.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Slices tipo SP y SI</b></font></p>     <p align="justify"><font face="verdana" size="2">En los est&aacute;ndares de codificaci&oacute;n de video anteriores, el cambio entre trenes de bits es posible, &uacute;nicamente en cuadros tipo <i>I, </i>reconstruyendo cuadros <i>I </i>a intervalos fijos, lo que permite el acceso aleatorio de los cuadros para reproducci&oacute;n r&aacute;pida del video <i>(fast forward/backward </i>). Sin embargo, el problema de usar cuadros <i>I </i>es que se requiere de un n&uacute;mero de bits mucho mayor y no se explotan las redundancias temporales.</font></p>     <p align="justify"><font face="verdana" size="2">En el H.264 se utilizan rebanadas de video tipo SP y SI para cambiar el tren de bits (Ghanbari, 2003). La <a href="/img/revistas/iit/v8n3/a4f9.jpg" target="_blank">figura 9</a> muestra c&oacute;mo utilizar los cuadros SP para cambiar entre diferentes trenes de bits. Suponiendo que existen dos trenes de bits, P(1,k) y P(2,k), correspondientes a la misma secuencia de video pero con diferentes velocidades binarias. Dentro del tren de bits codificado, los cuadros SP se colocan en una posici&oacute;n a la cual se permita un cambio de tren de bits.</font></p>     <p align="justify"><font face="verdana" size="2">En caso de cambiar del tren de bits superior P(1,3) al inferior P(2,3), se genera el cuadro SP S(3) que permite producir un cuadro decodificado P(2,3) utilizando P(1,2) de otro tren de bits, aun cuando haya compensaci&oacute;n de movimiento.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Tambi&eacute;n se puede utilizar una rebanada de video tipo SI de manera similar al SP, pero la predicci&oacute;n se formar&iacute;a utilizando el modo de predicci&oacute;n INTRA de 4x4 (Karczewicz, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Resistencia a errores</b></font></p>     <p align="justify"><font face="verdana" size="2">El particionamiento de los datos es un m&eacute;todo muy popular para incrementar la resistencia a errores del sistema. Los datos son particionados de acuerdo con su significancia dentro del tren de bits. Posteriormente, se transmiten primero los datos con mayor prioridad para reducir el error medio cuadr&aacute;tico de la secuencia a un m&iacute;nimo, posteriormente se transmiten los datos menos significativos. Tambi&eacute;n, la codificaci&oacute;n en capas (escalable) aumenta la resistencia a errores (transmisi&oacute;n de bits m&aacute;s significativos primero). Durante la codificaci&oacute;n escalable espacial o temporal se pueden recuperar datos perdidos en otras capas.</font></p>     <p align="justify"><font face="verdana" size="2">Este nuevo est&aacute;ndar incrementa la resistencia a errores de transmisi&oacute;n por medio de la contribuci&oacute;n de rebanadas tipo S, el ajuste de los par&aacute;metros de codificaci&oacute;n, el ordenamiento flexible de los macrobloques y el uso de rebanadas redundantes (Wenger, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Comparaci&oacute;n del esquema de codificaci&oacute;n del H.264 con otros esquemas</b></font></p>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4t8.jpg" target="_blank">tabla 8</a> muestra en an&aacute;lisis comparativo de los algoritmos de codificaci&oacute;n de video MPEG&#150;2 y MPEG&#150;4 parte 2 contra el H.264 (ISO/IEC JTC1/SC29/WG11 <i>Verification Tests on AVC, </i>2003).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Eficiencia de codificaci&oacute;n</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4t9.jpg" target="_blank">tabla 9</a> muestra las comparaciones del H.264 perfil L&iacute;nea Base (BP) del H.264 contra el Perfil Simple del MPEG&#150;4 parte 2 (SP) para secuencias con definici&oacute;n de multimedia (MD). Los n&uacute;meros en las tablas indican la mejora en la eficiencia de la codificaci&oacute;n. Por ejemplo, &gt; 2x significa que la eficiencia del H.264 fue m&aacute;s de dos veces la eficiencia del MPEG&#150;4 parte 2 Perfil Simple (ISO/IEC JTCI/SC29/WG11, 2000) y para la velocidad binaria de la secuencia indicada. La letra T significa que el H.264 fue transparente en la velocidad binaria para la secuencia dada. Estad&iacute;sticamente el H.264 BP tuvo una mejora en la eficiencia de la codificaci&oacute;n de 2 veces o m&aacute;s, en 14 de 18 casos probados.</font></p>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4t10.jpg" target="_blank">tabla 10</a> muestra la comparaci&oacute;n del H.264 Perfil Principal (MP) y el MPEG&#150;4 Parte 2 Perfil Simple Avanzado (ASP) para secuencias MD (ITU&#150;T H.264, 2003). Estad&iacute;sticamente el H.264 BP tuvo una eficiencia de codificaci&oacute;n de 2 veces o m&aacute;s que el MPEG&#150;4 parte 2 ASP, en 18 de 25 casos probados.</font></p>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4t11.jpg" target="_blank">tabla 11</a> muestra la comparaci&oacute;n entre el H.264 Perfil Principal (MP) y el MPEG&#150;2 para definici&oacute;n est&aacute;ndar (SD) (ITU&#150;T and ISO/IEC, 1994). Estad&iacute;sticamente el H.264 MP, tuvo una eficiencia de codificaci&oacute;n de 1.5 veces o m&aacute;s que el MPEG&#150;2HiQ, en 8 de 12 casos probados, de los cuales, en 3 casos el H.264 mostr&oacute; una mejora en la eficiencia de la codificaci&oacute;n de 2 veces o m&aacute;s y en 1 caso mostr&oacute; una mejora de 4 veces mayor.</font></p>     <p align="justify"><font face="verdana" size="2">Cuando se compar&oacute; contra el modelo de prueba 5 del MPEG&#150;2 (MEPG&#150;2 TM5), estad&iacute;sticamente, el H.264 Perfil Principal tuvo una eficiencia de codificaci&oacute;n de 1.8 veces o m&aacute;s en 9 de 12 casos probados, de los cuales, en 2 casos mostr&oacute; una mejora de 4 veces mayor.</font></p>     <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/iit/v8n3/a4t12.jpg" target="_blank">tabla 12</a> muestra la comparaci&oacute;n entre el H.264 Perfil Principal y el MPEG&#150;2 para alta definici&oacute;n (HD). Estad&iacute;sticamente, el H.264 Perfil Principal tuvo una eficiencia de codificaci&oacute;n de 1.7 veces mayor que el MPEG&#150;2 en 7 de 9 casos probados, de los cuales, en 3 casos mostr&oacute; mejoras de hasta 2 veces y en 1 caso de hasta 3.3 veces.</font></p>     <p align="justify"><font face="verdana" size="2">Cuando se compar&oacute; el modelo de prueba 5 del MPEG&#150;2 (MEPG&#150;2 TM5), estad&iacute;sticamente, el H.264 Perfil Principal, tuvo una eficiencia de codificaci&oacute;n 1.7 veces o mayor en 8 de 9 casos, de los cuales, en 4 casos mostr&oacute; una mejora de 2 veces mayor.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Codificador de audio</b></font></p>     <p align="justify"><font face="verdana" size="2">El H.264/MPEG&#150;4 parte 10, est&aacute; siendo adoptado por muchas compa&ntilde;&iacute;as de video tales como Phillips, Polycom, Ligos, Broadcom, Netvideo, Motorota, STMicroelectronics entre otras. El est&aacute;ndar se refiere &uacute;nicamente a la codificaci&oacute;n de video, dejando la libertad a las compa&ntilde;&iacute;as de elegir sus propios codificadores de audio. Por ejemplo, la empresa europea DVB est&aacute; considerando adoptar AAC&#150;SBR (Advanced Audio Coding &#150; Spectral Band Replication) llamado formalmente AAC plus, mientras que la empresa americana ASTC utilizar&aacute; AC&#150;3 plus de los laboratorios Dolby Labs.</font></p>     <p align="justify"><font face="verdana" size="2">Adem&aacute;s del H.264, China ha desarrollado su propio est&aacute;ndar de video llamado AVS (Audio Video Standard de China), el cual es un algoritmo similar, con algunas diferencias en los tama&ntilde;os de las transformadas, codificadores de entrop&iacute;a, filtros de desbloqueo, filtros de interpolaci&oacute;n para la compensaci&oacute;n de movimiento, etc.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Conclusiones</b></font></p>     <p align="justify"><font face="verdana" size="2">El presente art&iacute;culo describe al nuevo est&aacute;ndar de compresi&oacute;n de video H.264/MPEG&#150;4 parte 10, el cual supera a los est&aacute;ndares de video anteriores. Las principales diferencias se encuentran en la estructura de los bloques funcionales del algoritmo. Por ejemplo, compensaci&oacute;n  de  movimiento  en bloques  de tama&ntilde;o variable, interpolaci&oacute;n para exactitud fraccional,  filtro  de desbloqueo  adaptivo, rebanadas tipo SI y SP, mayor resistencia a los errores que los est&aacute;ndares anteriores, trasformada de 4x4, predicci&oacute;n con carga, CABC, CAVLC y predicci&oacute;n direccional para codificaci&oacute;n INTRA.</font></p>     <p align="justify"><font face="verdana" size="2">La tendencia actual de las empresas dedicadas al video se est&aacute; moviendo a favor de la implementaci&oacute;n del nuevo est&aacute;ndar para las diferentes aplicaciones como son, c&aacute;maras digitales, transmisi&oacute;n de video sobre redes IP, tel&eacute;fonos celulares, transmisi&oacute;n de video satelital, entre otras.</font></p>     <p align="justify"><font face="verdana" size="2">El siguiente paso que est&aacute; dando el grupo de expertos, es coordinar los t&eacute;rminos de las licencias para que las compa&ntilde;&iacute;as manufactureras paguen las regal&iacute;as correspondientes por el codificador&#150;decodificador y los t&eacute;rminos de las licencias.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Flierl M. and Girod B. (2003). Generalized B Picture and the Draft H.264/AVC Video&#150;Compression   Standard.   <i>IEEE </i><i>Transactions on Circuits and Systems for </i><i>Video Technology, </i>Vol. 13, pp. 587&#150;597, Julio.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237919&pid=S1405-7743200700030000400001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Ghanbari M. (2003). <i>Standard Codecs: Image Compression to Advanced Video Coding. </i>Hertz, UK: IEE.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237920&pid=S1405-7743200700030000400002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Golomb S.W. (1966). Run&#150;Length Encoding. <i>IEEE Trans. on Information Theory, </i>IT&#150;12, pp. 399&#150;401, Dic.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237921&pid=S1405-7743200700030000400003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Huang Y.W. (2005). Analysis, Fast Algorithm, and VLSI Architecture Design for H.264/AVC Intra Frame Coding. <i>IEEE Transactions on Circuits and Systems for Video Technology, </i>Vol. 15, pp. 378&#150;401, Marzo.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237922&pid=S1405-7743200700030000400004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ISO/IEC 11172&#150;2:1993 (1993). Information Technology, Coding of Moving Pictures and Associated Audio for Digital Storage Media at Up to About 1,5 Mbit/s&#150;Part 2: Video.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237923&pid=S1405-7743200700030000400005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ISO/IEC JTC1/SC29/WG11, "ISO/IEC 13818&#150;2: (1994). Information Technology&#150;Generic Coding of Moving Pictures and Associated Audio Information: Video,   ISO/IEC.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237924&pid=S1405-7743200700030000400006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ISO/IEC JTC1/SC29/WG11 (2003). Report of the  Formal Verification  Tests   on AVC  (ISO/IEC14496&#150;10 ITU&#150;T Rec. H.264)", MPEG2003/N6231, diciembre.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237925&pid=S1405-7743200700030000400007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ISO/IEC JTCI/SC29/WG11, ISO/IEC 14 496:2000&#150;2: (2000). Information on Technology&#150;Coding of Audio&#150;Visual Objects&#150;Part 2: Visual, ISO/IEC.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237926&pid=S1405-7743200700030000400008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ITU&#150;T H.262 (2000). International Telecommunication Union, Recommendation: Generic Coding of Moving Pictures and Associated Audio Information: Video, ITU&#150;T.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237927&pid=S1405-7743200700030000400009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ITU&#150;T H.264 (2003).  International Telecommunication Union, Recommendation: Advanced Video Coding for Generic Audiovisual Services, ITU&#150;T.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237928&pid=S1405-7743200700030000400010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">ITU&#150;T H261 (1993). International Telecommunication Union, Recommendation ITU&#150;T H.261: Video Codec for Audiovisual Service at px64 kbits," ITU&#150;T.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237929&pid=S1405-7743200700030000400011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Karczewicz M. and Kurceren R., (2003). The SP&#150; and SI Frames Design for H.264/AVC. <i>IEEE Transactions on Circuits and Systems for Video Technology, </i>Vol. 13, pp. 537&#150;544, Julio.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237930&pid=S1405-7743200700030000400012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">List    P.    (2003).    Adaptive    Deblocking Filter. <i>IEEE Transactions on Circuits and Systems for Video Technology, </i>Vol. 13, pp. 614&#150;619, Julio.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237931&pid=S1405-7743200700030000400013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Marpe D. (2003). Context&#150;Based Binary Arithmetic Coding in the H.264/AVC Video Compression Stan dard. <i>IEEE Transac</i><i>tions on Circuits and Systems for Video </i><i>Technology, </i>Vol. 13, pp. 620&#150;635, Julio.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237932&pid=S1405-7743200700030000400014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Ochoa H. and Rao K.R. (2005). A New Modified   Hybrid   DCT&#150;SVD   Coding System for Color Images. <i>WSEAS Transaction on Circuits and Systems, </i>Vol. 4, pp. 1246&#150;1253, Octubre.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237933&pid=S1405-7743200700030000400015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Ochoa H. and Rao K.R. (2006). A New Modified Version of the HDWTSVD Coding System for Monochromatic Images. <i>WSEAS Transaction on Systems, </i>Vol. 5, pp. 1190 &#150; 1195, Mayo.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237934&pid=S1405-7743200700030000400016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Richardson I. E.G. (2003). H.264 and MPEG&#150;4 <i>Video Compression: Video Coding for Next&#150;generation Multimedia, </i>Wiley.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237935&pid=S1405-7743200700030000400017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Sullivan G., Topiwala P. and Luthra A. (2004). The H.264/AVC Advanced Video Coding Standard: Over view and Introduction to the Fidelity Range Extensions. SPIE Conference on Applications of Digital Image Processing XXVII, Vol. 5558, pp. 53&#150;74, agosto.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237936&pid=S1405-7743200700030000400018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Wenger A. (2003). H.264/AVC Over IP. <i>IEEE Transactions on Circuits and Systems for Video Technology, </i>Vol. 13, pp. 645&#150;656, julio.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237937&pid=S1405-7743200700030000400019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Wien M. (2003). Variable Block&#150;Size Transform for H.264/AVC. <i>IEEE Transactions on Circuits and Systems for Video Technology, </i>Vol. 13, pp. 604&#150;613, julio.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4237938&pid=S1405-7743200700030000400020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Semblanza de los autores</b></font></p>     <p align="justify"><font face="verdana" size="2"><i><a name="a1"></a>Humberto de J. Ochoa&#150;Dom&iacute;nguez. </i>Estudi&oacute; su licenciatura en el Instituto Tecnol&oacute;gico de Veracruz, su maestr&iacute;a en el Instituto Tecnol&oacute;gico de Chihuahua y su doctorado en la Universidad de Texas en Arlington, apoyado por Fulbright y PROMEP. Trabaj&oacute; en el grupo de investigaciones de multimedia de Nokia, en Irving Texas, y actualmente es profesor investigador en la Universidad Aut&oacute;noma de Ciudad Ju&aacute;rez. Ha impartido diversos cursos tutoriales de codificaci&oacute;n de video y procesamiento de se&ntilde;ales en Singapur, Tailandia, Estados Unidos y la Rep&uacute;blica de Malta. En 1998, recibi&oacute; el premio Chihuahua por el trabajo "Sistema para la Clasificaci&oacute;n de Mamograf&iacute;as Digitales en Normales y Anormales Mediante el An&aacute;lisis de Textura y Detecci&oacute;n de Micro calcificaciones. Ha ofrecido conferencias en diversos foros de multimedia y procesamiento de se&ntilde;ales en varias partes del mundo y ha publicado en diferentes Journals y revistas arbitradas de reconocimiento nacional e internacional. Asimismo, es miembro de la Sociedad de Procesamiento de Se&ntilde;ales del al IEEE .</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i><a name="a2"></a>Jos&eacute; Mireles&#150;Garc&iacute;a. </i>Estudi&oacute; su licenciatura en ingenier&iacute;a industrial con especialidad en electr&oacute;nica, as&iacute; como su maestr&iacute;a en electr&oacute;nica en el Instituto Tecnol&oacute;gico de Chihuahua. Obtuvo su doctorado en ingenier&iacute;a el&eacute;ctrica en la Universidad de Texas en Arlington (UTA), apoyado por PROMEP. Actualmente es profesor investigador en la Universidad Aut&oacute;noma de Ciudad Ju&aacute;rez y profesor de investigaci&oacute;n adjunto de las Universidades de Texas en Arlington y de El Paso. Es miembro del Sistema Nacional de Investigadores (SNI,) de la Sociedad de Control y de la <i>SMC </i>de la IEEE. Asimismo, ha sido integrado en la lista de Strathsmore's Who's Who los a&ntilde;os 2002 y 2003. Fue visitante en la UTA de Agosto 2002 a Julio 2003, en cuyo per&iacute;odo tambi&eacute;n trabaj&oacute; en el Instituto de Rob&oacute;tica de UTA en Fort Worth TX como asistente de investigaci&oacute;n, y particip&oacute; en la recepci&oacute;n de fondos binacionales NSF&#150;CONACyT para desarrollo de trabajo en sistemas de eventos discretos. Sus &aacute;reas de inter&eacute;s son el dise&ntilde;o, fabricaci&oacute;n y prueba de los Sistemas Microelectromec&aacute;nicos (MEMS,) robotizaci&oacute;n y automatizaci&oacute;n y sistemas de eventos discretos. Ha impartido conferencias en diversos foros de rob&oacute;tica, automatizaci&oacute;n y MEMS en varias partes del mundo y ha publicado en diferentes Journals y revistas arbitradas de reconocimiento nacional e internacional, as&iacute; tambi&eacute;n ha participado en la organizaci&oacute;n de diversos foros nacionales e internacionales.</font></p>     <p align="justify"><font face="verdana" size="2"><i><a name="a3"></a>Juan de Dios Cota&#150;Ru&iacute;z. </i>Estudi&oacute; su licenciatura en el Instituto Tecnol&oacute;gico de Sonora y su maestr&iacute;a en el Instituto Tecnol&oacute;gico de Chihuahua. Trabaj&oacute; en el &aacute;rea de dise&ntilde;o de equipo de prueba para la empresa SMTC de Chihuahua y RCA Thomson. Actualmente trabaja como profesor investigador en el Departamento de Ingenier&iacute;a El&eacute;ctrica y Computaci&oacute;n de la Universidad Aut&oacute;noma de Ciudad Ju&aacute;rez en el &aacute;rea de Instrumentaci&oacute;n y Procesamiento de Se&ntilde;ales. Ha publicado en diferentes revistas arbitradas del pa&iacute;s.</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Flierl]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Girod]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Generalized B Picture and the Draft H.264/AVC Video-Compression Standard]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2003</year>
<volume>13</volume>
<page-range>587-597</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ghanbari]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Standard Codecs: Image Compression to Advanced Video Coding]]></source>
<year>2003</year>
<publisher-name><![CDATA[Hertz]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Golomb]]></surname>
<given-names><![CDATA[S.W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Run-Length Encoding]]></article-title>
<source><![CDATA[IEEE Trans. on Information Theory]]></source>
<year>1966</year>
<numero>IT-12</numero>
<issue>IT-12</issue>
<page-range>399-401</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Huang]]></surname>
<given-names><![CDATA[Y.W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Analysis, Fast Algorithm, and VLSI Architecture Design for H.264/AVC Intra Frame Coding]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2005</year>
<volume>15</volume>
<page-range>378-401</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="">
<source><![CDATA[ISO/IEC 11172-2:1993 (1993): Information Technology, Coding of Moving Pictures and Associated Audio for Digital Storage Media at Up to About 1,5 Mbit/s-Part 2]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="">
<source><![CDATA[ISO/IEC JTC1/SC29/WG11, "ISO/IEC 13818-2: (1994): Information Technology-Generic Coding of Moving Pictures and Associated Audio Information]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="">
<source><![CDATA[ISO/IEC JTC1/SC29/WG11 (2003): Report of the Formal Verification Tests on AVC (ISO/IEC14496-10 ITU-T Rec. H.264)", MPEG2003/N6231]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="">
<source><![CDATA[ISO/IEC JTCI/SC29/WG11, ISO/IEC 14 496:2000-2: (2000): Information on Technology-Coding of Audio-Visual Objects-Part 2]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="">
<source><![CDATA[ITU-T H.262 (2000): International Telecommunication Union, Recommendation: Generic Coding of Moving Pictures and Associated Audio Information]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="">
<source><![CDATA[ITU-T H.264 (2003): International Telecommunication Union, Recommendation: Advanced Video Coding for Generic Audiovisual Services]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="">
<source><![CDATA[ITU-T H261 (1993): International Telecommunication Union, Recommendation ITU-T H.261: Video Codec for Audiovisual Service at px64 kbits]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Karczewicz]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Kurceren]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The SP- and SI Frames Design for H.264/AVC]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2003</year>
<volume>13</volume>
<page-range>537-544</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[List]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Adaptive Deblocking Filter]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2003</year>
<volume>13</volume>
<page-range>614-619</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Marpe]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Context-Based Binary Arithmetic Coding in the H.264/AVC Video Compression Stan dard]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2003</year>
<volume>13</volume>
<page-range>620-635</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ochoa]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Rao]]></surname>
<given-names><![CDATA[K.R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A New Modified Hybrid DCT-SVD Coding System for Color Images]]></article-title>
<source><![CDATA[WSEAS Transaction on Circuits and Systems]]></source>
<year>2005</year>
<volume>4</volume>
<page-range>1246-1253</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ochoa]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
<name>
<surname><![CDATA[Rao]]></surname>
<given-names><![CDATA[K.R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A New Modified Version of the HDWTSVD Coding System for Monochromatic Images]]></article-title>
<source><![CDATA[WSEAS Transaction on Systems]]></source>
<year>2006</year>
<volume>5</volume>
<page-range>1190 - 1195</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Richardson]]></surname>
<given-names><![CDATA[I. E.G.]]></given-names>
</name>
</person-group>
<source><![CDATA[H.264 and MPEG-4 Video Compression: Video Coding for Next-generation Multimedia]]></source>
<year>2003</year>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sullivan]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Topiwala]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Luthra]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The H.264/AVC Advanced Video Coding Standard: Over view and Introduction to the Fidelity Range Extensions]]></article-title>
<source><![CDATA[]]></source>
<year>2004</year>
<volume>5558</volume>
<conf-name><![CDATA[ SPIE Conference on Applications of Digital Image Processing XXVII]]></conf-name>
<conf-loc> </conf-loc>
<page-range>53-74</page-range></nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wenger]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[H.264/AVC Over IP]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2003</year>
<volume>13</volume>
<page-range>645-656</page-range></nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wien]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Variable Block-Size Transform for H.264/AVC]]></article-title>
<source><![CDATA[IEEE Transactions on Circuits and Systems for Video Technology]]></source>
<year>2003</year>
<volume>13</volume>
<page-range>604-613</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
