Ayer tuvimos sesión del grupo de usuarios BIM de Sevilla (GUBIMSEV) que trataba sobre Inteligencia Artificial y su aplicación en entornos del sector AECO.
La sesión fue dirigida por Paco Gil y nos expuso, de forma sucinta, el entorno teórico dónde nos movemos con el tema de inteligencias artificiales y después nos hizo una demo de cómo usar algunas de las aplicaciones de creación de imágenes y también de texto.
Las de imágenes tienen en común la utilización de “prompts” (indicador en español) que son un conjunto de palabras para definir la imagen que buscas.
Entre las que vimos fueron las siguientes:
MIDJOURNEY.
Esta aplicación funciona bajo Discord y tiene una versión gratuita con un límite de imágenes a realizar y una de pago.
A partir de un prompt te propone 4 imágenes. A partir de ellas puedes hacer variaciones para afinar la solución que se adapte más a tus necesidades.
De todas las aplicaciones es la que saca imágenes más “épicas” y con un alto nivel de detalle.
La incomodidad es que hay que hacerlo a través de Discord.
DALL·E 2.
Esta es una versión mejorada de Dall·e y que actualmente está en fase beta.
Permite hacer lo mismo que Midjourney pero que tiene una cosa mucho más interesante que es que permite, partiendo de una imagen ya creada, editar la parte que queramos según el prompt que pongamos y modificar la imagen original con un resultado bastante bueno.
Esto lo podemos hacer marcando la zona dónde tiene que trabajar la aplicación.
Además, permite que partiendo de una imagen completar fuera de la imagen con el estilo y contexto de la imagen.
Consigue hacer unas imágenes realistas bastante buenas.
STABLE DIFFUSIÓN.
Esta es una aplicación similar a las otras, pero es un proyecto Open Source, por lo tanto, permitirá procesos de desarrollo más amplios que los de softwares propietarios.
Tiene una versión instalable para usarla en tu ordenador, pero es necesario tener una buena tarjeta gráfica.
Una ventaja de esta aplicación es que te permite entrenarla en que reconozca modelos, por ejemplo, si te haces 20 o 30 fotos tuyas de distintas posturas, enfoques, iluminación, etc te permite que use tu cara para ponerlo en distintos personajes o situaciones.
LÉXICA.
Como la mayoría de los programas están limitados en número de imágenes o son de pago por creación de ellas es fundamental, a la hora de generar los parámetros para afinar la creación de la imagen, realizar una buena selección de palabras del prompt.
Por lo tanto, han aparecido buscadores de prompts que te permiten afinar las búsquedas.
Entre ellos está este que te permite hacer búsquedas de imagenes como en Google y pinchando sobre ellas te propone prompts con las que se han generado.
CHATGPT.
ChatGPT, a diferencia de las otras, es una aplicación de generación de texto en formato de lenguaje natural que te permite hacer consultas, tener una conversación o incluso que te proponga código de programación para usar en distintas aplicaciones.
Es decir, parece que estás hablando con un “cuñao”.
Como está limitado su conocimiento hasta 2021, si quieres consultar cosas del año 2022 en adelante es necesario instalar una extensión para Chrome como:
- ChatGPT for Google. Te permite que cuando haces una búsqueda en Google te pone una columna con la información obtenida por el chatGPT
- WebchatGPT. Te permite que cuando hagas un escrito en chatGPT haga una búsqueda en Google para encontrar referencias a la información posterior a 2021 y con eso hace un resumen de las noticias que te encuentra.
CONCLUSIONES.
La sesión terminó comentando distintas posibilidades del software y riesgos que vemos en su aplicación como el uso de imágenes de personajes públicos o, de cara a los alumnos de la universidad, el hecho de copiar trabajos completos realizados por chatGPT.
Esto va a implicar un cambio de paradigma en el profesorado que tendrá que prepararse mejor y buscar alternativas a la hora de diseñar y evaluar los trabajos para garantizar que los alumnos aprendan.
Yo, en este sentido, veo interesante la tecnología blockchain para certificar que el elemento digital ha sido generado en un equipo, fecha, etc y que no ha sido manipulado.
De esta forma cuando veamos cosas por internet que no tenga ese certificado pues desconfiemos de ellas.
También está el típico miedo a la destrucción de empleo que siempre se da cuando viene una tecnología disruptiva.
En este sentido es interesante la conclusión de Sam Altman, el CEO de OpenAI (empresa creadora de Dall·e y ChatGPT), que comentaba el hecho de que siempre hemos pensado que las máquinas nos iban a quitar el trabajo manual y nos íbamos a quedar con el intelectual y, ahora en con este nuevo paradigma, parece que se está invirtiendo esa balanza y es todo el proceso artístico está en peligro.
Dejo enlace al video comentado en dotCSV
En cuanto a la aplicación en nuestro sector, veo muchas posibilidades.
La verdad es que es impresionante lo que parece que pueden hacer estas aplicaciones, pero como uno ya ha visto muchas demos de programas y después, cuando te toca usarlo en un proyecto concreto, no es tan bonito como lo pintan, pues desconfío de la aplicación tan sencilla.
A priori, puede ser interesante a la hora de buscar ideas y sacar, mediante prompts, algunas imágenes sugerentes para usarlas en los proyectos, pero los resultados que he probado no son muy usables por ahora.
Sí podría servir, con la aplicación de Dall·e, partir de una foto de la localización real del proyecto, marcar la zona dónde queremos actuar y que nos proponga soluciones integradas en la foto.
Habrá que probarlo.
Con la aplicación de texto sí que hay una aplicación rápida, por ejemplo, para proponer líneas de código para hacer nodos de Dynamo en Python.
Aunque probamos una, no estaba totalmente correcta y hubo que manipular algunas líneas. Pero, en definitiva, te da una base que te ahorras de escribir.
La sesión terminó grabando, junto con Paco Gil, un capítulo de BIMPodcast, que se emitirá cualquier día de estos, y en la que exponemos algunas conclusiones más.
Pero os las dejo pendiente para que las escuchéis en el capítulo.
ADVERTENCIA
Cuando estés leyendo esto, toda la información habrá quedado obsoleta.
Muchas gracias por leerme y un abrazo digital. |