Tecno News
DeepSeek es aire fresco para la tecnodiversidad
DeepSeek es aire fresco para la tecnodiversidad
Javier Blanco, experto de filosofía de la computación y sus vínculos con la política
Una pequeña empresa china de IA alcanzó a ChatGPT y pateó el tablero de la geopolítica, la ciencia y la economía, sorteando a puro software el ahogo de microchips con que Washington quiso frenar a Beijing.
function body_3(chk,ctx){return chk.f(ctx.getPath(false, ["author","title"]),ctx,"h");}
Por Julián Varsavsky
3 de febrero de 2025 - 00:01
. Imagen: Gentileza
La mayor obsesión de EE.UU. en su lucha tecnológica contra la potencia que amenaza su hegemonía ha sido mantenerse a la vanguardia del desarrollo de la Inteligencia Artificial: lo venía logrando con comodidad. Esto cambió en la misma semana que asumió Donald Trump. ¿El saludito de bienvenida? Los chinos parecen haber ascendido en la tabla de posiciones de la IA para compartir ya esa cima con su adversario. Cuando a EE.UU. se le mueve la estantería, repercute en Wall Street: las acciones de Nvidia --mayor productor de microchips de EE.UU. para la IA-- se desplomaron en un día por un valor de 589.000 millones de dólares: nunca en la historia le había pasado algo así a una empresa. Hay graves problemas, desde la perspectiva norteamericana. Pero el partido recién comienza y China lo acaba de empatar. Para analizar las estrategias de cada contendiente, Página/12 entrevistó a Javier Blanco, doctor en Informática por la Universidad de Eindhoven en los Países Bajos, profesor titular en la Universidad Nacional de Córdoba y director de la Maestría en Tecnología, Política y Culturas. Se especializa en temas de filosofía de la computación y los vínculos entre tecnología y política.
--Usted sabe de programación. Diseccionemos a DeepSeek R1 desde esta perspectiva y comparemos con ChatGPT. Son programas muy sofisticados y la calidad de respuestas y búsquedas que ofrecen están a la misma altura, según mi experiencia. ¿Qué los emparenta?
--Si bien en un cierto sentido son programas sofisticados, desarrollados a partir de técnicas y procesos complejos y costosos, en un sentido conceptual son sorprendentemente simples. A diferencia de otras ramas de la informática, los programas de machine learning son en general clasificadores estadísticos, capaces de reconocer y de generar patrones complejos que satisfagan ciertos criterios implícitos obtenidos a partir de los datos. En el caso de los modelos de lenguaje, como DeepSeek o ChatGPT aprenden a reconocer frases correctas. El generador produce frases al azar que son aceptables para el clasificador. Algo similar pasa con las imágenes. Luego de un entrenamiento con fotos de elefantes, el programa aprende a reconocer si hay elefantes en una foto nueva. Como sistemas algorítmicos son bastante simples. La complejidad está en el proceso de desarrollo, en la matemática usada para obtenerlos y en la cantidad de datos procesados. Tanto DeepSeek como ChatGPT pertenecen al grupo de programas que ocupan la primera plana en los últimos tiempos, los Grandes Modelos de Lenguaje (LLM por sus siglas en inglés) y sus similitudes en el funcionamiento son ostensibles. A diferencia de la mayoría de los desarrollos de software, los LLM necesitan detrás grandes infraestructuras computacionales y acceso a enormes repositorios de datos (esta última es la complejidad, no tanto el software). Quizá sea esta una de las razones de las enormes inversiones, muchas veces deficitarias. Estas espaldas económicas tan anchas que se suelen necesitar para estos desarrollos de IA incrementan las ventajas de las grandes corporaciones para picar en punta --aún perdiendo plata-- y conformar monopolios u oligopolios.
--¿Qué los diferencia?
--Entre las diferencias que tiene y/o dice tener DeepSeek, está el hecho de que fue hecha en China. Esto no sólo es una importante diferencia cultural sino también de contexto de producción. La adopción de un modelo abierto de software es fundamental y creo que eso va a alentar una cultura colaborativa en la producción de machine learning, análoga a la ya consolidada del software libre. La mayoría de los LLM fueron desarrollados en EE.UU. por lo que se enmarcan en un contexto cultural determinado, lo cual introduce, a veces de manera implícita, sesgos particulares. Si consideramos que existen diferentes “cosmotécnicas” --formas de articular técnicamente una visión del mundo con formas normativas y prácticas-- es esencial una variedad amplia en la producción de programas como los LLM que son tan usados e influyen en el devenir de las culturas. También será necesario desarrollar modelos propios en el sur global, cuyas especificidades exceden ampliamente la “cultura occidental”.
--Es curioso que la mayor amenaza a la hegemonía de Silicon Valley no llegó de una de las big-techs chinas --Baidu, Alibaba, Tencent, Xiaomi y Huawei-- sino de una startup poco conocida. Esta empresa no pica en punta: sería lo que en EE.UU. llaman un copycat, una imitación. No inventaron la rueda pero la alivianaron y achicaron los costos. ¿Qué información maneja al respecto?
--Hasta donde se sabe, tanto el costo de procesamiento como el de horas de trabajo humano fue mucho menor que los desarrollados en EE.UU. Habrá que sopesar bien las causas y las posibilidades que se abren. Es difícil dimensionar la relevancia de este avance tecnológico en la disputa geopolítica por el liderazgo de la IA, pero demuestra empíricamente la posibilidad de modelos alternativos de desarrollo. El objetivo manifiesto del gerente de DeepSeek no es la valorización financiera de su empresa, sino sumarse al avance del conocimiento de vanguardia. Y al proponerlo con un modelo de código abierto, se incorpora a una cultura tecnológica rica y transformadora con una historia interesante y exitosa. Es de esperar, como lo expresa el gerente de la compañía, que el compromiso con el código abierto favorezca la evolución de un ecosistema productivo en China, o incluso en el resto del mundo.
--Se acusa a DeepSeek de haberle robado los programas algorítmicos a ChatGPT. ¿Es posible técnicamente eso? ¿Mediante topos? ¿Hackeos?
--Circulan hipótesis y supuestas declaraciones, pero hay que ver qué queda cuando se disipe el humo. No hacen falta topos ni hackeos, no hay grandes secretos por develar, quizá sólo cierto know-how y conocimiento tácito que podría servir para otros emprendimientos, pero no es algo que pueda robarse. Escuché que se acusa a DeepSeek de usar a ChatGPT como modelo para “destilación” en el entrenamiento del propio. Un LLM ya desarrollado puede usarse para acelerar el entrenamiento de uno nuevo, tomándolo como un “oráculo” para mejorar la clasificación de las respuestas del nuevo modelo. Incluso si se hubiera usado de esa manera, sería un buen uso de los recursos, aprovechando el tiempo y recursos empleados en el primer modelo, para construir otros nuevos de manera más eficiente. Creo que esto muestra una buena alternativa para formas de desarrollo abiertas por venir.
--EE.UU. somete a China a un bloqueo comercial de microchips. Eso afectó parte del desarrollo chino. Pareciera que aun con esta desventaja, DeepSeek ha logrado algo asombroso: como no podía competir por el lado del hardware --tenía menor tecnología-- avanzaron por el lado más difícil: sobresalir a través del software para alcanzar al adversario. De ser así, es algo impresionante: ¡los alcanzaron a puro cerebro! Y lo hizo una empresa creada en 2023 que puso a un grupo de genios matemáticos de la programación a pensar cómo resolver problemas muy complejos, de manera más sencilla. ¿Lo lograron?
--Obviamente el proceso de desarrollo fue virtuoso y consiguieron resultados muy por arriba de lo esperado, y que esto se haya conseguido pese al bloqueo tecnológico es algo auspicioso para China y el resto del mundo. Sin duda hay mucho talento involucrado en estos desarrollos, y no sólo matemático o informático. Hacen falta miradas interdisciplinarias y equipos de trabajo innovadores, pero sobre todo objetivos valiosos compartidos, que no es algo que abunde en las empresas tecnológicas.
--China eludió estas sanciones mejorando sus propios microchips. Aunque aún está lejos de Occidente y sus aliados de Corea del Sur y Taiwán (la isla tiene la mejor empresa de chips del mundo, TSMC). El desarrollo de punta por sustitución de importaciones habría beneficiado a China, que innovó gracias a sus limitaciones, y no a pesar de ellas. Y EE.UU. dañó a sus propias empresas. ¿DeepSeek demostraría que falló la estrategia de Washington?
--Creo que muestra que no es una estrategia infalible, pero seguimos lejos en todo el mundo de alcanzar una tecnodiversidad necesaria para un desarrollo multicultural y sustentable. Los resultados obtenidos en China alientan a buscar caminos alternativos a la clausura tecnológica y política que buscan imponer desde EE.UU. al resto del mundo –consolidando sus monopolios tecnológicos--, algo que se sintetiza en la foto de los líderes de las corporaciones informacionales en la asunción de Trump, quien apuesta a ellos para su consigna “hacer a América grande otra vez”. Es esperable que siga este tipo de batalla por el liderazgo en IA, que no es bueno para nadie. Esperemos que cambie en el mediano plazo y haya estrategias multipolares no antagónicas, para lo cual es necesario fortalecer la colaboración en proyectos cuyo objetivo principal no sea el lucro.
--Surge una nueva estrella entre los CEO tecnológicos: Liang Wenfeng, empresario de Guangdong con perfil opuesto a Elon Musk. Ha dicho que parte de su éxito se debe a que DeepSeek estaría centrada en la investigación y no el lucro: “Nuestro principio no es perder dinero, ni obtener enormes ganancias... nuestro punto de partida no es aprovechar la oportunidad de hacer una fortuna, sino estar a la vanguardia de la tecnología y promover el desarrollo de todo el ecosistema”. Si es cierto, detrás estaría el Estado chino, al estilo modelo tigreasiático.
--Ojalá esto sea el inicio de una nueva cultura del desarrollo de modelos de machine learning, donde la experiencia de otros sea un insumo para el desarrollo. Si bien este tipo de cultura fue importante en los inicios del machine learning --gracias a la disponibilidad de modelos y bases de datos para entrenamiento-- en el último tiempo las grandes corporaciones están “cerrando” sus sistemas y usando infraestructuras que no pueden ser replicadas por actores más chicos. El problema no es sólo el lucro como principio rector, sino que se busca la valorización bursátil de las empresas que en general, son deficitarias. Paradójicamente, dado el bajo costo de producción de DeepSeek, es de las pocas que pueden llegar a tener ganancia y recuperar el dinero invertido, y no meramente depender de subsidios y de los avatares de Wall Street. Es curioso que los defensores del libre mercado entren en pánico cuando aparece algún atisbo de competencia real.
--¿Por qué habríamos de creer que no hay un interés lucrativo? Hay un fondo de inversión detrás de DeepSeek y se llama High-Flyer que había ganado 13.790 millones de dólares usando modelos de IA para predecir las variaciones en el mercado de acciones. Y en 2023 decidieron cambiar de rumbo para enfocarse en el desarrollo de la IA de punta.
--No es que no haya un interés lucrativo, sino que puede no ser el único o el principal. Lo que ya demostró el movimiento de software libre es que es posible obtener ganancias económicas compartiendo los avances tecnológicos, produciendo servicios de calidad y distribuyendo los costos de producción en una red colaborativa. Es otro modelo de desarrollo y negocios, viable para muchos y contrario a los monopolios. Impulsar un modelo análogo para el desarrollo de machine learning puede ser beneficioso para muchas startups en términos económicos, pero sobre todo es también una buena idea para el desarrollo de software necesario para la transformación social.
--En 2021 Liang informó que había acumulado 10.000 microchips de Nvidia. Al año siguiente Joe Biden profundizó las limitaciones de venta de semiconductores a China: prohibió venderles el potente chip H100 de Nvidia. Esta empresa desarrolló en cambio el chip H800 para el mercado chino y DeepSeek dice que con estos entrenó a su modelo de IA. Acaso China tenía reservas secretas de microchips. ¿Está en cuestión la hegemonía de EE.UU. en IA?
--Creo que por ahora EE.UU. lleva la delantera por mucho. Y como muestra de manera descarada toda esta política, “hacen trampa” respecto de las supuestas leyes del mercado. No cabe duda de que la principal disputa económica del siglo XXI es por el conocimiento. Las leyes de propiedad intelectual y patentes funcionan como una de las principales herramientas para apropiarse del conocimiento. No es claro que las empresas de IA en Silicon Valley respeten esas leyes, pero desde que apareció el modelo V3 de DeepSeek, desde diversas usinas comunicacionales insistieron con el tema del copyright. Y reinstalaron la sospecha por el uso de los datos de los usuarios por parte de una empresa china.
--¿Estamos en un momento Sputnik? Es el efecto que produjo en EE.UU. el lanzamiento por parte de la URSS de su primer satélite orbital. Creo que ahora es al revés: el Sputnik 1 fue ChatGPT. La respuesta al Sputnik fue la creación de la NASA y el lanzamiento del satélite Explorer 1. La respuesta china fue DeepSeek.
--Más allá de las analogías, creo que este logro de una pequeña start-up china es un poco de aire fresco y un impulso a buscar caminos alternativos de desarrollo. A diferencia de la carrera espacial y de la energía nuclear, no es necesario hoy que el futuro se dirima en una nueva Guerra Fría entre dos estados o bloques de países. La IA y en general el software, tienen una forma de existencia más ubicua y pueden construirse alternativas desde diferentes organizaciones de la sociedad civil. Esperemos que la gran concentración tecnológica producida por la IA en la última década sea la excepción y se retome el camino del software como bien común, lo que habilita modelos de desarrollo virtuosos y sobre todo diversos, contrastando con la homogeneidad que parece tranquilizar a los brokers y a sus representantes en algunos gobiernos.
--Hablemos de geopolítica. ¿Xi Jinping 1 - Donald Trump 0? ¿O China empató el partido y están 1-1?
--Creo que DeepSeek cambió el juego e inició un nuevo partido, algo desigual aún pero hay que ver cómo evoluciona. En cualquier caso, la agenda de Trump va más hacia la concentración y trata de evitar que el resto del mundo se desarrolle: esto es todo lo que está mal para el mundo. Es indispensable que se agreguen otros actores que puedan contrapesar a los gigantes de Silicon Valley y a la lógica del capital financiero.
--Aquí juega el asunto de la programación con códigos de fuente abierta. DeepSeek ofrece eso a los usuarios, incluyendo la capacidad de modificar el algoritmo. ¿Es así? ¿Cuántas personas están en condiciones de hacerlo? Sería extraño que China lo permita: sus buscadores tienen sesgos políticos estrictos. La pregunté a DeepSeek por la Masacre de Tiananmén y dio la información completa. En minutos, la borró diciendo “mejor hablemos de otra cosa”.
--Esperemos que esto no quede sólo en las intenciones; recordemos que ChatGPT fue desarrollado por una empresa de sugestivo nombre: OpenAI. Pero en los últimos sistemas que lanzaron, lo único que quedó de “abierto” es el nombre. Los LLM tienen múltiples lugares donde se puede modificar su comportamiento. Por un lado, está el modelo estadístico mismo, el que se crea a partir de los datos por un proceso de entrenamiento. Esto no puede modificarse de manera sencilla, ni siquiera por parte de quienes lo programaron. La gran ventaja está en disponer de ese código para producir nuevos modelos de manera más eficiente, con una gran parte del procesamiento ya hecho. Por otro lado, todos los sistemas interactivos tienen modificaciones a posteriori que hacen que el “comportamiento” sea decente, que no diga barbaridades o sea ofensivo: es una especie de “super yo” computacional. En esta fase utilizan mucha mano de obra barata en países periféricos, miles de personas haciendo el monótono trabajo de enseñarle al algoritmo obviedades, por sí o por no, y a “portarse bien”. Todo clasificador (o generador) estadístico producido por machine learning tiene sesgos intrínsecos al modelo mismo. Además, se puede moderar (o incrementar) esos sesgos a través de modificaciones a posteriori. Siempre es más fácil ver los sesgos políticos o ideológicos en el otro. No existen, por definición, sistemas que no tengan sesgos. Por eso la diversidad es valiosa.
--Liang, quien tiene 40 años, ha dicho que su objetivo con DeepSeek es alcanzar la Inteligencia Artificial General (AGI) que cambiaría la historia de la humanidad, una super IA mucho más veloz e inteligente que cualquier humano, e incluso que la humanidad en su conjunto.
--En verdad no es claro lo qué significa esto, hay mucha discusión científica y filosófica. Sería una inteligencia que actúe con la misma versatilidad y al menos en los mismos registros que la humana. No sé si el machine learning es la mejor tecnología para eso, pero tampoco creo que buscar la AGI sea el mejor camino a seguir. Decía Dijkstra que “el esfuerzo de utilizar máquinas para imitar la mente humana siempre me ha parecido bastante tonto: las usaría para imitar algo mejor”. Creo que estamos frente a la oportunidad de orientar una coevolución de mentes y programas, no se trata de imitar las formas cognitivas humanas, sino de inventar e integrar formas cognitivas diversas. Y desarrollar nuevos ambientes técnicos donde esto sea posible, orientados por valores colectivos y colaborativos. Esto es condición necesaria para que haya algún futuro para el mundo.
Tecno News
https://www.pagina12.com.ar/801169-deepseek-es-aire-fresco-para-la-tecnodiversidad
Empresas líderes en innovación revolucionan el mercado de electrodomésticos
Los gigantes de los electrodomésticos prometen convertir los hogares en centros eficientes.
Leer más
Cambio de domicilio por internet
Son muchas las operaciones que requieren de la constatación de un domicilio para efectuarse; de este dependerán el empadr ...
Leer más
Convocan aescuelas secundarias para inspirar a los adolescentes a acercarse a la tecnología
La Municipalidad de Bariloche y la empresa Globant, pronta a instalarse en la ciudad, invitan a escuelas de nivel medio a participar de ...
Leer más
Abren la inscripción a 13 cursos de oficios digitales en Bariloche
La Dirección de Trabajo del municipio de Bariloche abrió la inscripción para los cursos de oficios digitales 2021. ...
Leer más
Posicionamiento Web, ¿Natural o Pago Por Click?
Muchos de nuestros Clientes hacen las mismas preguntas, ¿El precio incluye el posicionamiento en los buscadores?, ¿Como e ...
Leer más
Con fotos satelitales, desarrollan alerta sobre la vegetación que aumenta la productividad
Investigadores de la Estación Experimental del Instituto Nacional de Tecnología Agropecuaria (INTA) en Bariloche desarrol ...
Leer más
Argentina, líder del mercado regional de Inteligencia Artificial
En los últimos años, diversos países de América Latina han realizado numerosos esfuerzos por incrementar su ...
Leer más
AudioStellar, un viaje a las galaxias sonoras
El software gratuito llevado a cabo en la Untref permite organizar y manipular librerías de sonido mediante un mapeo tímb ...
Leer más
Guía para elegir un buen servicio de hosting para tu web
Si tienes tu propio sitio de Internet o estás pensando en crear uno es importante que tengas en cuenta qué hosting vas a ...
Leer más
Emprendedores crearon una app gratuita para que la gente no haga fila en los comercios
Se llama Cauda y la idea es ponerlo a disposición de las cámaras de comercio de todo el país. “Es para evita ...
Leer más
Lanzan un Netflix libre y gratuito para distribuir contenidos audiovisales independientes
Se trata del portal Oeste Audiovisual, una plataforma de streaming libre y gratuita para mirar ...
Leer más
El 73% del personal provincial que realizó Teletrabajo quedó conforme con la modalidad
Mediante una encuesta realizada por la Función Pública sobre Teletrabajo, el 73% de los agentes de la provincia que traba ...
Leer más
Tres formas de proteger tus equipos ante bajones de luz
Los aparatos electrónicos son cada vez más inteligentes y sofisticados. No obstante, muy pocos saben que estas tecnolog&i ...
Leer más
La velocidad de internet más rápida del mundo: permite descargar 1000 películas en HD en un segundo
La velocidad de internet más rápida del mundo: permite descargar 1000 películas en HD en un segundo ...
Leer más
Hidrógeno Verde: las celdas de combustible, baterías inagotables
El almacenamiento de las fuentes de energía en dispositivos que garanticen rendimiento y durabilidad es una de las claves del hi ...
Leer más
Por la pandemia, el volumen del tráfico de internet en Argentina registró un nuevo récord
El tráfico de internet en la Argentina registró en mayo un nuevo récord al alcanzar una media de 1 terabyte por se ...
Leer más
Tecnologías libres para combatir al COVID-19
Nicolás Camargo Lescano (Agencia CTyS- UNLaM)- Como parte de un ciclo de encuentros destinados especialmente a la comunidad educ ...
Leer más
¿Cómo operar con Bitcoin de manera práctica y segura?
Cada vez son más las personas que están interesadas en ingresar en el mundo financiero y las criptomonedas son grandes re ...
Leer más
Invap: La tecnología nos permite ser competitivos internacionalmente
La empresa estatal rionegrina firmó un contrato para construir dos radares de uso civil que serán exportados a Ni ...
Leer más
El Fab Lab se transforma
El Laboratorio de Fabricación Digital ingresará a una nueva etapa, de co-gestión entre el Estado Municipal y la co ...
Leer más
Entró en vigencia la Prestación Básica Universal para telefonía, internet y TV por cable
La Prestación Básica Universal tiene el carácter de "obligatoria", con el objeto de que todo ...
Leer más
Controla tu privacidad, seguridad y bienestar digital de formas que sientas correctas para ti.
Aca compartimos un sitio muy util para controlar la privacidad y seguridad en redes
Leer más
Científicos de Argentina y Alemania crean un novedoso láser de sonido
A partir de experimentos con partículas en un estado cuántico llamado “Condensado Bose-Einstein”, físi ...
Leer más
Cafecito, la aplicación para monetizar emprendimientos
Por esa razón, existen distintas aplicaciones para que los usuarios puedan ayudar de forma sencilla con un aporte econ& ...
Leer más
Los argentinos no paran de comprar online: creció la venta por clasificados de autos y propiedades por MercadoLibre
Se divulgaron la evolución de los hábitos del consumidor en los últimos tiempos: ¿cuáles fueron las ...
Leer más
Robot argentino busca reemplazar al glifosato: quita malezas con rayo láser y usa luz solar
Se trata de un importante avance en el mundo del agro ligado a la tecnología que ayudará a controlar la superficie de una ...
Leer más
Sagora - Agora Sonora
SAGORA es un software libre y gratuito, diseñado y desarrollado por artistas/investigadores de la Escuela Universitaria de Artes ...
Leer más
Yaeltex: en busca de una herramienta para cada artista
El clan de desarrollo de hardware MIDI sacó nueva generación de controladores a medida
Su flamante placa a ...
Leer más
La ONG Bitcoin Argentina abre las inscripciones a su ciclo de charlas abiertas gratuitas y cursos con modalidad virtual.
Bitcoin y blockchain llegaron para inaugurar un nuevo paradigma y democratizar el intercambio de valor. Las puertas de este nuevo mundo ...
Leer más