Intel muestra su Kights Landing, 72 cores x86 en un CPU

Publicado por Fabio Baccaglioni el 27/11/2013 a las 23:14 (1745)
Los Xeon Phi son los procesadores de cálculo especiales de Intel, ya hemos hablado varias veces aquí de la idea de los Many Cores, algo que empezó como un experimento y rápidamente pasó a ser el foco de la empresa hasta dejando de lado la idea de un GPU discreto potente propio, se dieron cuenta del potencial de esto en un segmento bien distinto a los gráficos y muy aprovechado por AMD y NVidia, el cálculo.



La generación anterior del Xeon Phi necesitaba sí o sí de un procesador Xeon y el MIC (Many Integrated Core) en un slot PCIe aparte, incluía 61 cores y estos estaban basados en el viejo y conocido core P54C pero con agregados como soporte de 64 bits y registros de vectores de 512bits, llamado Knights Corner, era bueno pero ese requerimiento del Xeon extra le restaba un poco a la idea (y sumaba costos).

El nuevo Knights Landing es una versión superadora, no sólo más núcleos con 72 cores sino que no requiere de un procesador acompañando al CPU, los P54C son reemplazados por núcleos Silvermont (out-of-order) similares a los Atom, implementan instrucciones AVX-512, controlador de memoria incorporado para DDR4-2400 ofreciendo hasta 16GB de RAM 3D incorporada (en el mismo packaging!) y unas 36 líneas de PCIe. Una bestia.

Al ser independiente de otros Xeon el Knights Landing se transforma en el controlador y permite sumar más bloques en los puertos PCIe disponibles.



Para dar una idea de performance, el nuevo procesador puede generar hasta un pico de 6 teraflops (precisión simple), unos 3 teraflops en precisión doble, comparativamente con un Haswell lo pasa por encima seis veces, éste otorga un máximo de 500 gigaflops. El otro foco es el consumo, al utilzar núcleos Silvermont estamos hablando de entre 14 y 16 Gigaflops por Watt, comparativamente con el promedio de las supercomputadoras actuales, éstas rondan los 4 gigaflops por Watt.

Los 16GB incorporados en el packaging otorgan unos 500GB/segundo disminuyendo notablemente las latencias. Considerando estas performances y cuatro sockets en un rack 1U, con un rack 42U se podrían alcanzar los 500 teraflops, dos de estos nos llevan al Petaflop, así es, dos racks 42U te dan una supercomputadora de un petaflop, un poco más y estamos hablando de un super equipo a 100 Petaflops.

Para 2015 planean una versión especial con interconexión HPC de Cray vía fibra óptica y links QSFP a 100Gbps para los 32 canales PCIe 3.0

Más detalles en Extreme Tech

Intel, de 14nm a Atoms de 64 Bits

Publicado por Fabio Baccaglioni el 26/11/2013 a las 12:47 (1831)


Intel es un tanque difícil de detener, muchos creen que no sabe adaptarse pero la realidad es que tiene mucho más cash que la mayoría de sus competidores y una ambición enorme. Cuando ARM apareció en escena y se puso a robarle un mercado, hasta ese momento, pequeño, no reaccionó y tuvo que tomar medidas demasiado tarde pero ¿Fueron en vano? no lo creo.

Hoy por hoy muy pocos fabricantes hacen uso de los Atom en dispositivos móviles pero poco a poco la tendencia parece cambiar, una de las razones es la inversión fuerte en investigación y desarrollo de la empresa en el área, y hay dos áreas en las que tiene el foco, por un lado los procesos de fabricación que ningún otro tiene, y por otro el atacar directo los procesadores móviles.

Tal vez lo que pocos ven en este momento es la importancia del nodo de 14nm, la evolución es tan significativa que los demás fabricantes estan desesperados tratando de lanzar nuevos nodos para poder llegar a competirle. Hoy por hoy TSMC y Global Foundries estan trabajando en 28nm bastante bien, los nuevos procesadores para celulares se desarrollan bajo ese proceso pero ¿Bajar a la mitad el tamaño del silicio? es algo que sólo Intel puede ofrecer, más detalles a continuación.

Cómo es el procesador de la PS4 por dentro

Publicado por Fabio Baccaglioni el 21/11/2013 a las 12:38 (3729)
Ya que Sony no develará esto y AMD tampoco la gente de Chipworks no se sentó a esperar un anuncio oficial, entraron al chip de la Playstation 4 para averiguarlo por ellos mismos.

La diferencia entre el procesador actual y el de la Playstation 3 es muy importante y principalmente se trata del crecimiento cada vez mayor del área dedicada al GPU. Los juegos actuales no requieren tanto CPU como antes pero sí cada vez más exigencia gráfica y es por eso que la superficie creció superando al CPU.



Las ocho unidades de x86 Jaguar son bien visibles en esta radiografía el procesador, cada bloque tiene cuatro unidades, con su propia caché L2, el GPU es interesante porque no sólo ya tiene disponible un tercio de todo el silicio utilizado (recuerden que no sólo es CPU+GPU, hay controladores de memoria y muchos otros integrados aquí) sino que en vez de ser las 18 unidades gráficas declaradas ¡hay 20!

¿Por qué dos de más? bueno, hay varias razones posibles, una redundancia, para evitar desperdiciar chips que salieron defectuosos de fábrica y que siempre se pueda asegurar las 18 unidades de GPU prometidas, algo así como el procesador Cell que tenía 8 unidades pero se usaban menos, esto habilita la producción masiva sin tanto rechazo de silicio y baja los costos.

El silicio ocupa unos 328 mm2, el GPU es básicamente una implementación completa de un Radeon HD 7870 en un proceso de 28nm, si lo comparamos con el GPU de la PS3, que se fabricaba a 40nm, el nuevo es aun más grande, la importancia que ha tomado en el silicio es total.

¿Podrá abaratar más los costos Sony? pues si todo sigue como lo esperado la fábrica de TSMC empezará a producir a 20nm, el diseño de AMD en teoría debería poder aplicarse en esta planta pero la transición llevará un tiempo. Al achicar el tamaño del silicio necesario en un 30% se ahorra material, se reduce consumo eléctrico y le da una ventaja a la producción de la PS4 que, actualmente, da pérdida por cada equipo vendido. Algo normal en los lanzamientos de las consolas y sabiendo que el negocio de Sony no es la venta del equipo sino que cada uno tenga una PS4 en su casa, no es un problema para nada.

Por su parte AMD va a subir su cuota de mercado más que nunca, tanto PS4 como XBoxOne utilizando sus APU, un logro inesperado para un fabricante en problemas, seguramente ahora con un respiro sustancial al poder proveer la última generación de consolas de procesadores.

Via ExtremeTech

MediaTek lanzará el primer Octa Core real (no 4+4) para móviles

Publicado por Fabio Baccaglioni el 20/11/2013 a las 14:13 (9175)


¿Ocho núcleos? ¿en serio? ¿en un móvil? ya era ridículo en una PC de escritorio y nunca llegaron a ser relevantes más allá de Workstations y Servidores, hasta los de seis núcleos tuvieron poco uso porque el software no necesita tantos núcleos si no se van a hacer tantas cosas a la vez.

Y dudo mucho que tener un SQL Server en un teléfono sea el objetivo, pero así es, en la ridícula tendencia de más numerito MediaTek anuncia que antes de fin de año estarán lanzando al mercado su ARM de ocho núcleos reales, no como el caso de Samsung que son cuatro y cuatro, ocho al mismo Cortex-A7 tiempo.

Los Cortex-A7 son de bajo consumo, para comparar con el Octa de Smasung, éste tenía cuatro A15 y cuatro A7, MediaTek propone uno de ocho Cortex-A7 fabricados en proceso de 28nm que pueden operar simultáneamente a una velocidad de entre 1.7 y 2GHz.

Según la empresa browsers como Chrome ya hacen uso de los múltiples núcleos y según sus benchmarks ofrecen mayor performance que el más famoso actual Snapdragon 800, menor consumo (habrá que ver pruebas reales), además de ofrecer un procesador de imagenes de 16MP, un GPU Mali 450 a 700Mhz, la posibilidad de video 4K, decoding de H.264, H.265, VP9, también un modem propio para 4G.

Antes de fin de año estará disponible para los fabricantes de móviles y tablets.

Via Gogi.in

AMD Kaveri, 512 procesadores en el GPU

Publicado por Fabio Baccaglioni el 12/11/2013 a las 15:29 (1652)
AMD hoy adelantó detalles de su nuevo procesador "todo en uno", los AMD Kaveri basados en el CPU Steamroller con dos bloques de dos núcleos cada uno para el modelo Quad Core, y lo interesante viene por el lado del GPU principalmente.



El modelo testeado por AMD en la APU13 puede alcanzar los 862 GFLOPS en su GPU que cuenta con 512 stream processors, no sólo eso, adquiere también dos tecnologías que comparte la nueva línea de placas de video, Mantle API y TrueAudio poniéndolo a la altura aun siendo un GPU que se encuentra en el mismo silicio que el CPU.

El AMD Kaveri demostrado alcanzó a brindar un Battlefield 4 a 1920x1080 entre 25 y 40fps, compararivamente con su rival directo, los Haswell de Intel, éstos no logran superar los 15fps.

Parte de la estrategia de AMD es justamente dedicarle mucho espacio del circuito al GPU, un 47% según sus números, contra un 31% en el caso de Haswell, 27% en Ivy Bridge y 17% en Sandy Bridge y aunque la cantidad de espacio no es medida de nada, evidentemente es más un GPU que un APU. La idea de AMD de fusionar todo tuvo más éxito del esperado siendo que ambas empresas que fabrican x86 lo estan haciendo.



Estan lanzando nuevos SDK , AMD APP 2.9, plugins para Visual Studio y soporte OpenCL desde los mismos, soporte para CMAKE, un gran empuje al soporte para HSA, OpenCV, Bolt, etc. además de SDK para post-procesamiento multimedia aprovechando el GPU.

Los Kaveri van a estar disponibles algo tarde, 14 de Enero de 2014 no llegando para las fiestas lamentablemente, serán para socket FM2+ , el flagship será el A10-7850K con cuatro núcleos Steamroller a 3.7GHz, todavía sin precios y seguramente con muchos más modelos alcanzables. La cuestión será ¿Estarán al fin a la altura de Intel? hay mucha expectativa al respecto...

Stratix 10 FPGA con ARM pero ¿fabricado por Intel?

Publicado por Fabio Baccaglioni el 30/10/2013 a las 11:56 (3798)


Altera es una de esas empresas que se mueve por otro mundillo informático no tan conocido por no ser parte de los productos de consumo, así que la noticia es medio extraña porque planean lanzar un procesador ARM Cortex A53 de 64 bits y cuatro núcleos, el primero con esas características.

El actual procesador A7 de Apple es farbicado por Samsung y cuenta con dos núlceos de 64-bits, pero en este caso hablamos de un quad core y sumándole el extraño fabricante elegido, Intel, que es competidor directo de ARM con su Clover Trail.

Es seguramente el proceso de fabricación de 14nm lo que necesita Altera, con este proceso pueden reducir a la mitad el consumo y el tamaño de silicio utilizado, pero ni Qualcomm ni NVidia ni Samsung van a temblar todavía, es que Altera no hace procesadores para equipos de consumo, es para routers y equipos embebidos con anchos de banda de hasta 56 Gbps.

Ahora bien, un FPGA a más de 1GHz es toda una novedad en el segmento, con más de 10TFLOPs en punto flotante simple, anchos de banda de 2.5 Tbps en la memoria y más de 100 GFlops/Watt de rendimiento, además se venderá como SoC también. Aclaración: el FPGA es programable, el SoC ya viene con estructura definida.

El raro aquí es Intel sirviendo de fabricante de chips rivales, y no es que necesiten espiar el diseño (ARM es bastante abierto y, por ende, popular, por esa razón), pero es como que AMD le fabrique placas de video a NVidia más o menos.

Via Altera y CNET

Imagination presenta un nuevo CPU MIPS, Warrior

Publicado por Fabio Baccaglioni el 14/10/2013 a las 21:16 (1679)
Y lo menciono en particular porque no se trata de un ARM ni de un x86, tampoco un PPC, es uno de arquitectura MIPS y esta tecnología no estaba siendo tenida en cuenta por el mercado. Hay muchos microcontroladores usando MIPS pero parecía que el crecimiento de ARM lo había enviado al cajón de los recuerdos, pues no, aquí un nuevo CPU.

El P5600 es un procesador MIPS de 32 bits que apunta a mercados móviles, con soporte a extensiones de memoria de 40 bits (hasta 1TB de RAM comparado con el límite de 4GB de los 32 bits), un engine SIMD de 128 bits (Single Instruction, Multiple Data), virtualización por hardware, hasta seis núcleos con caché coherente, caché L2, y más en el SoC.



Según Imagination es capaz de ejecutar unos 3.5DMIPS por Mhz, a la altura teórica de un ARM Cortex A15, pero hasta no verlo en vivo y en directo no se puede confirmar semejante afirmación, esto lo logra con un 30% menos de superficie de silicio (por ende debería ser más barato). El rango de reloj va de 1GHz a 2GHz. El proceso de fabricación será el de 28nm de TSMC.

Imagination tiene en su roadmap un procesador similar pero ya de 64bits y es obvio que estan buscando una tajada del mercado de ARM ya que luego de viejos éxitos como la PS1, PS2, los routers, los cablemodems y todo eso donde todavía se usa MIPS (los Loongson chinos por ejemplo) habían quedado muy en desuso hubo un punto crucial, ellos fabrican el GPU PowerVR pero he aquí que ARM decidió crear su propio diseño, el Mali, y eso empezó a quitarles mercado.

No sólo eso, el mercado de GPUs está muy saturado, falta que AMD haga GPUs para móviles y listo, porque Qualcomm, NVidia, Intel, ARM e Imagination tienen sus propios diseños en mercados que no soportan más de dos variantes en el largo plazo y ni hablar que Samsung, su principal cliente, podría tranquilamente crear su propio GPU y dejarlos completamente afuera del negocio.

Pues bien, el Warrior es eso, el CPU para competir y darle cuerpo al PowerVR, si tiene la potencia del Exynos 5 que promete, pues bien, tendrá alguna chance, igualmente todavía no hay SoCs existentes, ya que recién empiezan a licenciarlo, veremos a futuro que equipos lo llevarán.

Via Imagination Technologies

Intel Atom Z3000, una nueva generación distinta de Atom

Publicado por Fabio Baccaglioni el 12/09/2013 a las 00:34 (1978)


Esta semana Intel presentó la primera tanda de Atoms que son realmente nuevos y sin estar basados en una arquitectura anterior, con nuevo diseño y características que realmente apuntan a ser lo más competitivo del mercado contra ARM.

Los primeros Atom estaban basados en los diseños del viejo Pentium, en cambio los Bay Trail, y su diseño interno Silvermont, nuevos tienen una arquitectura completamente distinta. Silvermont es un diseño que se utilizará también en los Avoton y los Merrifield por ejemplo, es muy flexible y esa es la idea.

El target de estos procesadores son tres sistemas operativos, Linux, Windows 8 y Android, así es, abiertamente apuntan a esto que es casi como apuntar a TODO.

El Z3000 consiste en dos o cuatro núcleos con gráficos de Intel, dejando de lado los de PowerVR que necesitaban hasta ahora los Cover Trail+ o, como en los viejos Intel, un chip separado. En este caso es un SoC con GPU propio de Intel integrado.

A continuación les detallamos lo nuevo para tablets y celulares y hasta notebooks y all-in-one que ofrecerá Intel y el revivir de dos marcas clásicas del fabricante.

El Samsung Exynos 5 Octa usará sus ocho núcleos a la vez

Publicado por Fabio Baccaglioni el 10/09/2013 a las 11:03 (1366)


A partir de un update que llegará a varios equipos en los próximos meses el SoC Exynos 5 Octa de Samsung podrá hacer algo que lo transformará realmente en un procesador de ocho núcleos: usarlos todos a la vez.

El diseño big.LITTLE de ARM le permite tener cuatro CPUs Cortex A15 y otros cuatro Cortex A7 en un mismo integrado, los primeros para hacer operaciones de alto rendimiento, los segundos para consumir poco haciendo treas simples. El tema es que hasta ahora o funcionan unos o funcionan los otros pero nunca todos a la vez.

Es que la idea original era la búsqueda de la eficiencia energética, el tema es que esto choca con la venta de "ocho" núcleos ya que nunca se podían usar al mismo tiempo.

Lo que anunció Samsung es el Heterogeneous Multi-Processing o HMP que permite la distribución de threads complejos a los A15 y simples a los A7 de una forma más eficiente y al mismo tiempo, esto afectaría las posibiliades del Samsung Galaxy S4 y otros usuarios del Exynos 5 como el Meizy MX3, ya que no hay otro usando big.LITTLE todavía aun cuando MediaTek anunció procesadores propios con la idea.

Esto tampoco implica que el S4 reciba un update para usarlo, pero si abre las puertas a equipos como notebooks, desktops simples y all in one con este procesador y que tengan un pico de performance por encima de lo que ofrecen hoy en día.

Lo curioso es cuanto se va pareciendo esto a las propuestas de AMD de "Fusion" de hace un tiempo ¿no?

via Samsung

La discontinuidad de NVidia, Kepler móvil

Publicado por Fabio Baccaglioni el 02/08/2013 a las 15:38 (1791)
En los últimos tiempos competir en la época del ARM es todo un desafío pero a la vez una oportunidad, a diferencia del mercado del x86, cerrado para sólo dos competidores y no mucho más, el de ARM es mucho más diverso y entretenido y, a la vez, desafiante.



NVidia entró tarde al mercado pero era inevitable, el negocio de los GPU tiene un futuro sombrío y al no poder ofrecerlos junto a un CPU como hacía AMD estaban a merced de Intel que también intenta crear los propios.

En cambio en los móviles hay mucho espacio para moverse con los GPU, hay competidores, pero no hay una tecnología final ni definida, además, con sólo enfocarse en OpenGL tienen un estandar definido por lo que cualquiera puede ingresar.

De esta forma Nvidia con sus SoC Tegra viene intentándolo pero es en el área del GPU donde todavía no lograban replicar el trabajo de las grandes placas de video que tienen en un formato de bajo consumo como los ARM, bueno, eso parece cambiar un poco.

El plan de NVidia es llegar a 2014 con el primer SoC con un GPU Kepler que va a cambiar radicalmente la performance gráfica móvil, por un lado el mismo trabajo con ARM para el CPU contando con un ARM Cortex A15 mejorado, seguramente el 4+1 que ya usaron en el Tegra con un core extra más liviano para tareas simples y los cuatro (o más) cores pesados para lo importante. El proceso de fabricación es probable que se mantenga en el de 28nm, aun así el plan apunta a 20nm a 2015.

El tema aquí está en Kepler, el GPU, con unos 192 núcleos CUDA y llevando, por primera vez, el poder de un GPU móvil a la performance de una placa de video discreta de PC de escritorio, si, suena exagerado y hasta no verlo en vivo no sabremos si es posible mantener un consumo bajo en esto, pero el plan es superar la capacidad de una GTX 8800 o una PS3 para darles una idea.

El mismo gráfico muestra el objetivo de desbancar al máximo exponente, el iPad 4, y notar la diferencia en órdenes de magnitud directamente ¿es esto posible?



Estamos hablando de apenas un año adelante, es decir, no es puramente teórico, el trabajo en los procesadores empieza años antes, esto implica que NVidia ya tiene valores preliminares y probablemente apunten en este sentido. Ahora bien, el gráfico habla de GFLOPS , no de ancho de banda de memoria, donde NVidia ha tenido muchos problemas en sus Tegra, ahí se ve la performance REAL y final que tiene un SoC.

Ofrecer 5 veces la potencia en punto flotante que el PowerVR SGX 554MP4 (el del iPad 4) es prometer mucho, estamos hablando de algo así como 400GFLOPS y considerando los 192 cores CUDA con 2 FLOPS cada uno (da 384FLOPS por ciclo) necesitarías un reloj a 1GHz para poder alcanzar los 400GFLOPS, esto, aun considerando los 28nm del proceso de fabricación, implica mucho calor para un smartphone y una batería imposible.

Pero NVidia durante el Siggraph no habló de gigahertz todavía así que es porbable que esta sea la diferencia de performance en laboratorio y luego en un equipo real se use un clock a la mitad de potencia, igualmente sería casi tres veces la performance que el mayor exponente actual, no mucha diferencia pero sin dudas bien por encima de lo que hay hoy en día.

Ya pensar en tener la performance de una PS3 en un móvil es algo que da para idear mucho, considerando el proyecto Shield que ya empezó a mover públicamente NVidia nos da también la perspectiva de cómo estan buscando posicionarse como los que mandan a la hora de hablar de Gaming en portátiles, no en software, en hardware ¿será NVidia el futuro XBox o Playstation? no lo sabemos pero sin la performance de éstos sería imposible lograrlo.

Kepler oferce APIs OpenGL ES 3.0, OpenGL 4.4 y DirectX 11, en ese sentido no hay quien pueda rivalizarle todavía y esto le abre la puerta a todos los frameworks de desarrollo existentes, en paridad con una PC de escritorio o una notebook y hasta una XBox, a la larga es mayor probabilidad de juegos portados a móviles.

El Kepler tiene un canal de alimentación separado para el GPU, por lo tanto es fácil medir el consumo dedicado a los gráficos y separado del resto, en ese sentido en las demos estan logrando unos 900mW corriendo a la misma performance que un iPad4, con un total de 2.6W y aun así el Kepler es capaz de ofrecer gráficos muy buenos a 1W y esto en un equipo de prueba sin refinar.



Si logran mayor performance y menor consumo que un A6X, el líder actual en esa relación, estarían quebrando una importantísima barrera en el mercado móvil porque esto abriría la posibilidad de jugar en móviles títulos como los que hoy en día encontramos en una PS3 o XBox360 con una duración de batería acorde y sin quemarnos las manos, eso es una revolución, o más bien una evolución porque viendo el camino trazado en móviles todo hace pensar en el entretenimiento como fin esperado.

Aun sin el Tegra 4 en el mercado todavía, el NVidia Logan con el GPU Kepler ya está siendo anunciado, falta más de un año seguramente, pero es interesante ver la velocidad en la que necesitan hacer anuncios para mantenerse vivos aun a costa de canibalizar sus productos más recientes, pero claro, un SoC para móviles con la misma tecnología que un GPU de escritorio es... para comentar al menos.

Más sobre el Logan-Kepler en Anandtech
213 Noticias (22 páginas, 10 por página)



Powered by
Cake Division