La discontinuidad de NVidia, Kepler móvil

Publicado por Fabio Baccaglioni el 02/08/2013 a las 15:38 (1630)
En los últimos tiempos competir en la época del ARM es todo un desafío pero a la vez una oportunidad, a diferencia del mercado del x86, cerrado para sólo dos competidores y no mucho más, el de ARM es mucho más diverso y entretenido y, a la vez, desafiante.



NVidia entró tarde al mercado pero era inevitable, el negocio de los GPU tiene un futuro sombrío y al no poder ofrecerlos junto a un CPU como hacía AMD estaban a merced de Intel que también intenta crear los propios.

En cambio en los móviles hay mucho espacio para moverse con los GPU, hay competidores, pero no hay una tecnología final ni definida, además, con sólo enfocarse en OpenGL tienen un estandar definido por lo que cualquiera puede ingresar.

De esta forma Nvidia con sus SoC Tegra viene intentándolo pero es en el área del GPU donde todavía no lograban replicar el trabajo de las grandes placas de video que tienen en un formato de bajo consumo como los ARM, bueno, eso parece cambiar un poco.

El plan de NVidia es llegar a 2014 con el primer SoC con un GPU Kepler que va a cambiar radicalmente la performance gráfica móvil, por un lado el mismo trabajo con ARM para el CPU contando con un ARM Cortex A15 mejorado, seguramente el 4+1 que ya usaron en el Tegra con un core extra más liviano para tareas simples y los cuatro (o más) cores pesados para lo importante. El proceso de fabricación es probable que se mantenga en el de 28nm, aun así el plan apunta a 20nm a 2015.

El tema aquí está en Kepler, el GPU, con unos 192 núcleos CUDA y llevando, por primera vez, el poder de un GPU móvil a la performance de una placa de video discreta de PC de escritorio, si, suena exagerado y hasta no verlo en vivo no sabremos si es posible mantener un consumo bajo en esto, pero el plan es superar la capacidad de una GTX 8800 o una PS3 para darles una idea.

El mismo gráfico muestra el objetivo de desbancar al máximo exponente, el iPad 4, y notar la diferencia en órdenes de magnitud directamente ¿es esto posible?



Estamos hablando de apenas un año adelante, es decir, no es puramente teórico, el trabajo en los procesadores empieza años antes, esto implica que NVidia ya tiene valores preliminares y probablemente apunten en este sentido. Ahora bien, el gráfico habla de GFLOPS , no de ancho de banda de memoria, donde NVidia ha tenido muchos problemas en sus Tegra, ahí se ve la performance REAL y final que tiene un SoC.

Ofrecer 5 veces la potencia en punto flotante que el PowerVR SGX 554MP4 (el del iPad 4) es prometer mucho, estamos hablando de algo así como 400GFLOPS y considerando los 192 cores CUDA con 2 FLOPS cada uno (da 384FLOPS por ciclo) necesitarías un reloj a 1GHz para poder alcanzar los 400GFLOPS, esto, aun considerando los 28nm del proceso de fabricación, implica mucho calor para un smartphone y una batería imposible.

Pero NVidia durante el Siggraph no habló de gigahertz todavía así que es porbable que esta sea la diferencia de performance en laboratorio y luego en un equipo real se use un clock a la mitad de potencia, igualmente sería casi tres veces la performance que el mayor exponente actual, no mucha diferencia pero sin dudas bien por encima de lo que hay hoy en día.

Ya pensar en tener la performance de una PS3 en un móvil es algo que da para idear mucho, considerando el proyecto Shield que ya empezó a mover públicamente NVidia nos da también la perspectiva de cómo estan buscando posicionarse como los que mandan a la hora de hablar de Gaming en portátiles, no en software, en hardware ¿será NVidia el futuro XBox o Playstation? no lo sabemos pero sin la performance de éstos sería imposible lograrlo.

Kepler oferce APIs OpenGL ES 3.0, OpenGL 4.4 y DirectX 11, en ese sentido no hay quien pueda rivalizarle todavía y esto le abre la puerta a todos los frameworks de desarrollo existentes, en paridad con una PC de escritorio o una notebook y hasta una XBox, a la larga es mayor probabilidad de juegos portados a móviles.

El Kepler tiene un canal de alimentación separado para el GPU, por lo tanto es fácil medir el consumo dedicado a los gráficos y separado del resto, en ese sentido en las demos estan logrando unos 900mW corriendo a la misma performance que un iPad4, con un total de 2.6W y aun así el Kepler es capaz de ofrecer gráficos muy buenos a 1W y esto en un equipo de prueba sin refinar.



Si logran mayor performance y menor consumo que un A6X, el líder actual en esa relación, estarían quebrando una importantísima barrera en el mercado móvil porque esto abriría la posibilidad de jugar en móviles títulos como los que hoy en día encontramos en una PS3 o XBox360 con una duración de batería acorde y sin quemarnos las manos, eso es una revolución, o más bien una evolución porque viendo el camino trazado en móviles todo hace pensar en el entretenimiento como fin esperado.

Aun sin el Tegra 4 en el mercado todavía, el NVidia Logan con el GPU Kepler ya está siendo anunciado, falta más de un año seguramente, pero es interesante ver la velocidad en la que necesitan hacer anuncios para mantenerse vivos aun a costa de canibalizar sus productos más recientes, pero claro, un SoC para móviles con la misma tecnología que un GPU de escritorio es... para comentar al menos.

Más sobre el Logan-Kepler en Anandtech

El camino hacia los 7nm, 5nm y 3nm

Publicado por Fabio Baccaglioni el 29/07/2013 a las 12:48 (1555)


Hay límites para cada tipo de material y el silicio está llegando al máximo con los procesos de fabricación de 14 nanómetros, es que la industria no se detiene en ese ínfimo tamaño y de alguna forma intenta estirar la ley de Moore una vez más.

Los procesos de 14nm utilizan FinFET de silicio pero para pasar a 10nm este material no sirve, es que se dan dos efectos físicos llamados "quantum tunneling" y el más comnocido "gate leakage" en el que los electrones se "escapan" generando ruido en la señal, el silicio no logra contenerlos.

Pero la industria ya trabaja en 10nm, 7nm, 5nm y hasta 3nm, buscando siempre llegar al átomo mísmo hasta que la electrónica deje de ser tal y no se pueda usar más. En el caso de 10nm se necesitan nuevos materiales y se encontraron en la combinación de Silicio y Germanio (Si-Ge) o Germanio puro, con mayor movilidad de electrones y por ende menores voltajes, y esto evita todos esos feos problemas de pérdidas, consumo excesivo y tunneling que afecta al silicio. Pero el mismo Germanio tiene sus limitaciones.

El germanio se usa hace mucho tiempo (quien electrónico no recuerda los diodos de germanio!) así que el cambio de una industria a la otra no tendría tanto impacto, pero he aquí que no alcanza y que el germanio es escaso (el silicio es arena, vidrio, fácil de conseguir, complicado de purificar pero bien conocido y masivo).



El paso a 7nm ya es más complicado, si bien Si-Ge sirve para llegar allí hay que cambiar la estructura de los transistores por ejemplo con GAA (Gate All Around) o tunel vertical (TFET) pasando a usar nanocables para lograr el efecto de achicar y contener el tunneling.

Una tercera opción es el uso de III-V de Gallio-Arseniuro (un ion de arsénico con tres electrones extra). El tema es que ya se ven tres caminos posibles que se abren del actual ¿cual será el correcto? ¿el que pueda llegar a 3nm?. Muchos hablan del grafeno y los nanotubos pero estan muy lejos de poder meterse en el circuito de procesadores, por el momento estos otros materiales y complejos transistores son los que estarán en nuestros futuros equipos.

Más detalles en Extreme Tech

Nuevo Exynos 5 Octa

Publicado por Fabio Baccaglioni el 23/07/2013 a las 12:39 (782)


Samsung sigue avanzando en su gama de procesadores Exynos 5 Octa con un nuevo integrante de la familia, el 5420 es un SoC que sigue con la idea de ocho núcleos, cuatro de alto poder, cuatro de bajo consumo (nunca se usan los ocho a la vez, vale aclararlo), en configuración big.LITTLE.

El GPU es un Mali-T628, y el CPU cuenta con los cuatro núcleos A15 a 1.8Ghz más los cuatro A7 a 1.3FHz. Según la firma logra un 20% más que el anterior en CPU y un 100% más en gráficos 3D. El controlador de memoria de doble canal LPDDR3 está con un clock a 933MHz lo que le otorga un ancho de banda de 14.9GBps, bastante alto para un procesador móvil (siempre lejos de los anchos de banda de un x86 o un GPU discreto, por ejemplo).

Con este ancho de banda ya apuntan a HD WiFi para video, además de mejoras en procesamiento de imagen, control de consumo de energía, y demás.

Obviamente todavía falta la "novia" de este procesador, cual será el que lo utilice ¿Galaxy S5? ¿una tablet? no se sabe pero sí que a partir de Agosto comienza la producción en serie.

Via Engadget

Apple volviendo a Samsung para fabricar sus procesadores

Publicado por Fabio Baccaglioni el 15/07/2013 a las 10:49 (1467)
Vieron que en esto de los negocios todos tienen cara de hereje, a nadie se le cae la cara jamás tampoco, así que no hay ni amigos ni enemigos, "son sólo negocios" diría Don Corleone.



Imaginen que a Samsung nada le había gustado que Apple los dejase afuera de la fabricación de los procesadores de Apple, los A8 pasaron a ser de TSMC, uno de los otros pocos fabricantes de procesadores del mundo (no son más de cinco) y el contrato preveía la produccion en 20nm incluyendo a la siguiente generación A9/A9X

Pero no, miren que son cambiantes estos mercados, Samsung demostró su proceso de fabricación a 14nm y eso fue más que suficiente para sacarle el contrato a TSMC y llevarse nuevamente a Apple a su casa.

Tengan en cuenta que considerando el volúmen de venta poseer a Apple como cliente es una entrada de dividendos asegurada, no será el que mejor paga pero gana por volúmen y, en el mercado de procesadores, es la mejor forma de ganar dinero.

El nodo de 14nm empezará a ver la luz en 2015, todavía ni siquiera estamos viendo el resultado del acuerdo con TSMC que ya sabemos con qué se despachará la manzanita en dos años, pero así de previsores tienen que ser, tampoco hay actualmente procesadores de 14nm en el mercado e Intel va a un ritmo más que acelerado en ese sentido con planes de lanzar procesadores en un proceso similar tan pronto como este año.

Lo que no se sabe todavía es si TSMC conservará su contrato para producir el A9 en 20nm y si saldrán modelos de los dos fabricantes al mismo tiempo en distintos procesos.

Via MacRumours

Intel Bay Trail, se filtran datos de los procesadores

Publicado por Fabio Baccaglioni el 05/07/2013 a las 13:07 (1199)
El núcleo Silvermont de los Bay Trail de Intel no son exclusivamente para celulares o tablets, su target es mucho más amplio y tendrá una gran variedad de modelos, para conocerlos aprovechemos que se filtraron algunos datos de los mismos:



Como verán las marcas Atom, Celeron y Pentium siguen vivas, en modelos que van desde el single core hasta quad core, clocks de 1.46GHz a 2.41GHz, el GPU de 400Mhz a 792Mhz, un TDP desde 4.5 a 10W, estos modelos estan orientados específicamente a notebooks, netbooks y tablets, además de media centers y todo tipo de dispositivo, por eso la gran variedad.

No son los Bay Trail-T que tienen un consumo menor todavía y son, por lo general, partes de mayor calidad para el mercado móvil.

Via XBitLabs

Se filtran primeros benchmarks del Intel Bay Trail-T ¿demasiada performance?

Publicado por Fabio Baccaglioni el 03/07/2013 a las 23:55 (2551)


Intel está apostando muy pero muy fuerte a un futuro en móviles, dejó escapar la tortuga, no lo volverá a hacer, está clarísimo. Los esfuerzos post-Atom son impresionantes y la dedicación que estan poniendo a bajar los típicos consumos del x86 también.

Antutu es un benchmark para Android que una vez generados los resultados los envía a una lista general, allí apareció el primer dato más o menos relevante de la performance del Bay Trail T, muy malas noticias para ARM.

Con un clock a 1.1GHz pasa por encima con un 30% más al Snapdragon 800 a 2.3GHz, si esto fuese cierto y el Bail Trail sale al mercado con el reloj a 2.1GHz como prometió Intel, definitivamente del lado de ARM se tendrán que poner a trabajar muy duro para equipararlo. Pero claro, es el primer número ¿sería real lo de 1.1GHz? o ¿el número estaba mal medido?

El equipo de referencia con Bay Trail utilizaba Android 4.2.2 y logró un puntaje en Antutu de 43,416, el S800 anda por los 30,000 por lo que si el 1.1GHz es real... habrá que ver el tema del consumo para una comparativa performance por watt.

El Bail Trail T cuenta con cuatro núcleos Silvermont que son la primer gran evolución en los últimos cuatro años de los Atom y, siempre según Intel, logra tres veces más performance que un Medfield/Clover Trail con cinco veces menos energía. Esa es una afirmación muy exagerada, por más que el proceso de fabricación sea de 22nm y sumen muchas características de los Westmere más grandes ¿tres veces más performance consumiento cinco veces menos? habrá que verlo en un benchmark controlado sin las manos de Intel cerca.

Lo que si podemos asegurar es que el Atom era una porquería cuando salió al mercado y que Intel aprendió de ese error muchísimo, en el Silvermont hay ejecución out-of-order, predicción de branch mucho más eficiente, recuperación de colisiones en el pipeline, un FPU completamente mejorado, ejecuta una mayor cantidad de operaciones por ciclo de reloj y tiene un clock más acelerado, pero insisto, hasta no verlo en acción...

Via Extremetech

Qualcomm Snapdragon 800, la bestia

Publicado por Fabio Baccaglioni el 19/06/2013 a las 01:46 (2404)
Y mientras ayer comentaba que AMD se metía de lleno a producir procesadores ARM en 2014, todavía estamos en 2013 y apareció el que será, por el momento, el ARM más potente para tablets y celulares, el Snapdragon 800.



El SoC MSM8974 Snapdragon 800 cuenta con cuatro cores Krait 400 a 2.3GHz y un GPU Adreno 330 a 450GHz, soporta memorias LPDDR3 a 800MHz (2x32, 2GB), es capaz de procesar video UHD 4K (3840 x 2160) a 30fps o 120Mbps como les guste verlo (H.264 High Profile) sin problemas en hacer mirroring vía microHDMI.

Para presentarlo, como se hace muchas veces, Qualcomm lo mostró en una tablet y un smartphone "modelos" para poder ejemplificar su uso (no son equipos finales ni de marca alguna), la única diferencia es la pantalla, 1080p de 11.6" para la tablet, 720p de 4.3" para el smartphone y baterías de 3400 y 1500 mAh respectivamente.

El resto de los equipos de demo son 2GB de RAM, 32GB de almacenamiento, USB 3.0, cámara de 12MP, frontal de 2MP, LTE y sensores hasta de presión y humedad.

¿Donde radica la diferencia entre estos y los Krait 200-300? básicamente en el proceso de fabricación. El proceso anterior era el de 28nm LP polisilicio, los clocks llegaban hasta 1.5-1.7GHz, al cambiar el de 28nm HPM de High-K Metal Gates, como usa Intel, por ejemplo, el Krait 400 se puede clockear hasta los 2.3GHz aunque la mayoría de estos se usarán a 2.2GHz.



La caché es más rápida también y el GPU Adreno 330 está mejorado con respecto al 320 en arquitectura, no sólo en clock.

Las cifras de benchmarks son impresionantes peleando cabeza a cabeza con el núcleo Cortex A15 de ARM, cabe aclarar que los Krait son una modificación de Qualcomm de los ARM y estan entre un Cortex A8 y un Cortex A15, por ejemplo tiene un pipeline de 11 etapas contra uno de 15,17 o 25 que puede tener un A15 más grandes diferencias en el bus de memoria y cache.

El GPU logra hasta el doble de performance que el Adreno 320 anterior, es literalmente una bestialidad de diferencia, tanto NVidia como PowerVR tendrán gran trabajo por delante para vencerlo, aunque este último todavía le gana en algunos benchmarks de OpenGL. Comparado con un GPU de PC obviamente la cosa no es tan así, pero está a la altura de una NVidia 8500GT o una Radeon HD 6310.

El Snapdragon 800 es el mayor esfuerzo de Qualcomm para competirle a los A15 y a PowerVR, tanto por CPU como GPU pero evidentemente se ha logrado principalmente con el nuevo proceso de fabricación, a partir de la siguiente generación será la arquitectura la que deberá evolucionar principalmente en mejorar el ancho de banda de la memoria.

Pueden ver los geniales benchmarks de Anandtech aquí

AMD comenzará a producir procesadores ARM el año que viene

Publicado por Fabio Baccaglioni el 18/06/2013 a las 11:53 (1541)
De alguna forma AMD tiene que sobrevivir y si algo saben hacer es procesadores. El problema es que Intel es demasiado poderosa y grande para ser vencida y AMD siempre anda en rojo con sus finanzas (no son precisamente buenos administradores del dinero que tienen), por lo tanto hay un nicho en el que, hasta ahora, no se metían y estaban dejando en manos de otros rivales: ARM.



Los procesadores ARM los fabrican casi todos, Samsung, TSMC, Texas Instruments, Qualcomm, NVidia, y una enorme lista de empresas, y tienen una particularidad, su bajo consumo. De esta forma resultan ideales para cierto tipo de servidores de bajo consumo como los que se usan para Cloud Servers, no son centros de cómputo especializados pero sí pueden hacer muchas tareas pequeñas a un bajo coste.

Para 2014 AMD planea salir de su comodidad del x86 y ofrecer los "Seattle", nuevos procesadores basados en 8 a 16 núcleos ARM Cortex-A57 con soporte hasta 128GB de RAM, unos 2GHz de clock para los núcleos, proceso de fabricación de 22nm, conectividad integrada de 10GbE, utilizando el AMD Freedom para interconexión entre procesadores de alta densidad, pensados para big data obviamente.

Todo esto viene de la mano de la compra de Seamicro que ya fabricaba servidores con ARM, AMD e Intel, bueno, por qué no aprovecharlo y hacer lo propio, ahora vuelven a los ARM y con un procesador que, al menos en los papeles, le va a significar un duro golpe al Intel Avoton que viene del lado de los Atom

Via Anandtech

Se viene el Haswell de 8 núcleos

Publicado por Fabio Baccaglioni el 17/06/2013 a las 11:03 (1421)


Hasta ahora los Intel Haswell habían apuntado a notebooks y bajos consumos pero siempre estamos esperando el anuncio del lanzamiento de los procesadores para entusiastas, los que realmente importan Risa, es decir, mucho poder.

Los nuevos Haswell-E son para el 2014 pero ya se conocen detalles, para empezar el "negativo", es que no habrá en 2014 (salvo que pase algo especial) nuevo Tick, el Broadwell de 14nm alargará su aparición.

Lo que sí habrá son Haswell de 6 y 8 núcleos y con hasta 20MB de L3, esto más el Hyper Threading que llevaría a los Haswell hasta 16 procesadores lógicos, 40 lanes para PCIe y un TDP que se elevará hasta los 140W todo fabricado en un proceso de Hi-K de 22nm de segunda generación.

Todo esto será acompañado del chipset Wellsburg con soporte para DDR4 hasta 2133MHz (Quad Channel), hasta 6 puertos USB 3.0, 8 USB 2.0, 10 SATA de 6Gbps, soporte de reloj integrado, un TDP de 6.5W, 8x PCIe 2.0, MAC integrada de 1Gbps.

Las DDR4 utilizan 1.2V, un conector de 288 pines, hasta 16 bancos, y obviamente todo esto implica nuevo motherboard, nuevas memorias, nuevo procesador, el socket para el micro es el LGA 2011-3 que mide lo mismo que los anteriores, 58.5x51 mm, y apenas cambian algunos pines para que sólo los procesadores de esta generación puedan conectarse.

Via VR Zone

Lanzamiento oficial de Intel Haswell

Publicado por Fabio Baccaglioni el 06/06/2013 a las 10:16 (2782)


Al fin Intel lanza a nivel global el Haswell, la nueva generación de Intel Core con cambios importantes en su estructura interna y procesos de fabricación. Si ya estaban al tope, ahora suben la barra un poco más.

Intel tiene sus tiempos de tick-tock que ya estan bien definidos, el Haswell era inevitable y en algún punto uno cree que Intel podría tomarse un descanso de un año que igual nadie lo va a alcanzar.

Pero así son ellos, persisten, y mientras ARM crezca en el horizonte móvil ellos no dejarán que nadie les quite el ritmo (y de paso tratan de meterse allí con importantes esfuerzos). Pasen ahora a conocer a la última y mejor creación de CPUs para PCs.

204 Noticias (21 páginas, 10 por página)



Powered by
Cake Division