Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

IBM docilng, SpaCy: extraccion Tablas en documento PDF, TXT por páginas con generacion de oraciones

Автор: saXsa Big Data

Загружено: 2025-01-04

Просмотров: 44

Описание:

IBM docilng, SpaCy para Extracción: TXT, Tablas, Imágenes y Oraciones en documentos PDF y Office

Curso práctico 22 enero 2025 Via ZOOM

A todas y todos

Para arrancar el año con toda la energia que acumulamos en las fiestas y buenos deseos navideños, ofrecemos un curso via ZOOM

En estos días he estado preparando el material para el curso.

En la búsqueda de ejemplos, encontre un excelente ejemplo que la DGTIC UNAM ofrece.

Se refiere a una Revista donde se publican documentos relativos a TIC, Tecnologías de la Información y Comunicación, en donde se solicitan contribuciones para publicar.

Que mejor que publicar articulos del uso de la Inteligencia Artificial.

Para muestra analizamos el último número con mecanismos de RAG y asi construir un sistema de BÚSQUEDA SEMÁNTICA en forma local con herramientas de código abierto.





Fecha: Miercoles 22 enero 2025

Horario: 7pm - 9:30pm

Cuota recuperación: 1,000 pesos + i.v.a.

Si requiere factura, enviar constancia de situacion fiscal

Tema: Generación de servicios de Inteligencia Artificial en particular Busqueda Semantica y Preguntas&Respuestas (Q&A) utilizando herramientas de código abierto TODO EN FORMA LOCAL con equipos PC SIN NECESIDAD DE LLAVES:

Usamos

IBM docling. Para recibir documentos de formatos PDF generados, PDF escaneados, word, excel, powerpoint, html, formatos gráficos PARA EXTRACCION DEL TEXTO, TABLAS E IMAGENES

SpaCy. Para la extraccion de las oraciones y analisis de Procesamiento de Lenguaje Natural

Embeddings. Para la generación de vectores de las oraciones con modelos como BGE-m3, InstructOR u otros vectorizadores de código abierto

ChromaDB o Milvus. Para almacenamiento de vectores en una BDVectorial

LangChain. Para mecanismos RAG para servicio de Busqueda Semantica

LLM IBM Granite con Ollama. Para servicio de Preguntas/Respuestas (Q&A) utilizando el LLM Granite en un ambiente Ollama

Curso práctico 22 enero 2025 Via ZOOM

Fecha: Miercoles 22 enero 2025

Horario: 7pm - 9:30pm

Cuota recuperación: 1,000 pesos + i.v.a.

Si requiere factura, enviar constancia de situacion fiscal

NOTA SOLIDARIA

A todos aquellos que tengan muchas ganas pero pocos recursos, se les ofrece beca al 50%, ... pero se deben manifestar antes del 15 de enero 2025

Se les compartira antes del curso el material de todos los códigos y documentos para que no sufran tecleando, ... no es un curso de mecanografia, sino de transmisión de conocimiento con códigos ya generados que funcionan

En la Inteligencia Artificial Empresarial de Grandes Volúmenes se deben utilizar herramientas YA PROBADAS que FUNCIONEN aun sin ser lo ultimo existente como los modelos de la Inteligencia Artificial de Innovación

TODO CON HERRAMIENTAS QUE FUNCIONAN EN AMBIENTES LOCALES CON EQUIPOS PC para la construcción de los Modelos de Operacion basicos, ... que despues se ESCALAN A GRANDES VOLUMENES en arquitecturas en GPU y en ambientes de red

Atte

Dr. Gabriel Guerrero

[email protected]

Ver Adelantos (trailers) ya grabados en el canal YouTube de saXsa

Tenemos mas de 350 videos de los temas de interés



ID Canal YouTube: @saxsabigdata1400

Algunos ejemplos:





IBM docling, herramienta indispensable en el Mundo Financiero para Extracción de Tablas e Imágenes

ID_YouTube:: 2tRuUxnKEcg




IBM docling Instalación Ambiente Conda Python3.11 y Jupyter para extracción texto, tablas e imágenes

ID_YouTube:: gvU1MZj90So




SpaCy NLP Natural Lenguage Processing Instalacion con ambiente Jupyter para extracción de oraciones

ID_YouTube:: ZFuuv5sN3mw

IBM docilng, SpaCy: extraccion Tablas en documento PDF, TXT por páginas con generacion de oraciones

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

array(10) { [0]=> object(stdClass)#4263 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "S4RlH9nJvRU" ["related_video_title"]=> string(93) "ResumenTexto con herramientas Ollama DeepSeek en un ambiente local SIN LLAVES Parte1 20250502" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> string(14) "saXsa Big Data" } [1]=> object(stdClass)#4236 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "ZEByYsji7gc" ["related_video_title"]=> string(59) "Parte 9 GobernanzaDocumentos Cumplimiento LGA NARA 20250604" ["posted_time"]=> string(25) "3 недели назад" ["channelName"]=> string(14) "saXsa Big Data" } [2]=> object(stdClass)#4261 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "SXWcA9PN8RY" ["related_video_title"]=> string(48) "Analsis de PDF Escaneado de Estados Financieros" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> string(14) "saXsa Big Data" } [3]=> object(stdClass)#4268 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "Rj41nTmdkCM" ["related_video_title"]=> string(60) "Gobernanza Documentos Cumplimiento LGA NARA Parte 7 20250603" ["posted_time"]=> string(25) "3 недели назад" ["channelName"]=> string(14) "saXsa Big Data" } [4]=> object(stdClass)#4247 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "jPHYFWQ3wZ0" ["related_video_title"]=> string(99) "Gobernanza Documentos Cumplimiento Ley General Archivos e Inteligencia Artificial Parte 5 20250602" ["posted_time"]=> string(25) "3 недели назад" ["channelName"]=> string(14) "saXsa Big Data" } [5]=> object(stdClass)#4265 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "ati3Wsc-QoU" ["related_video_title"]=> string(174) "СЛИТЫЕ ДОКЛАДЫ ФСБ: КИТАЙ ВЕДЕТ КИБЕРВОЙНУ ПРОТИВ РОССИИ. И присматривается к Дальнему Востоку" ["posted_time"]=> string(23) "5 часов назад" ["channelName"]=> string(19) "Майкл Наки" } [6]=> object(stdClass)#4260 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "3w763aFC27s" ["related_video_title"]=> string(132) "⚡️ Кремль сорвал попытку ареста Путина || Срочная переброска войск НАТО" ["posted_time"]=> string(24) "17 часов назад" ["channelName"]=> string(23) "Время Прядко" } [7]=> object(stdClass)#4270 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "22tkx79icy4" ["related_video_title"]=> string(55) "RAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!" ["posted_time"]=> string(23) "1 месяц назад" ["channelName"]=> string(8) "AI RANEZ" } [8]=> object(stdClass)#4246 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "aircAruvnKk" ["related_video_title"]=> string(101) "Но что такое нейронная сеть? | Глава 1. Глубокое обучение" ["posted_time"]=> string(19) "7 лет назад" ["channelName"]=> string(11) "3Blue1Brown" } [9]=> object(stdClass)#4264 (5) { ["video_id"]=> int(9999999) ["related_video_id"]=> string(11) "xqr4JkVHY4U" ["related_video_title"]=> string(105) "Историческое решение по Украине / НАТО идёт в наступление" ["posted_time"]=> string(24) "16 часов назад" ["channelName"]=> string(10) "NEXTA Live" } }
ResumenTexto con herramientas Ollama DeepSeek en un ambiente local SIN LLAVES Parte1 20250502

ResumenTexto con herramientas Ollama DeepSeek en un ambiente local SIN LLAVES Parte1 20250502

Parte 9 GobernanzaDocumentos Cumplimiento LGA NARA 20250604

Parte 9 GobernanzaDocumentos Cumplimiento LGA NARA 20250604

Analsis de PDF Escaneado de  Estados Financieros

Analsis de PDF Escaneado de Estados Financieros

Gobernanza Documentos Cumplimiento LGA NARA Parte 7 20250603

Gobernanza Documentos Cumplimiento LGA NARA Parte 7 20250603

Gobernanza Documentos Cumplimiento Ley General Archivos e Inteligencia Artificial  Parte 5 20250602

Gobernanza Documentos Cumplimiento Ley General Archivos e Inteligencia Artificial Parte 5 20250602

СЛИТЫЕ ДОКЛАДЫ ФСБ: КИТАЙ ВЕДЕТ КИБЕРВОЙНУ ПРОТИВ РОССИИ. И присматривается к Дальнему Востоку

СЛИТЫЕ ДОКЛАДЫ ФСБ: КИТАЙ ВЕДЕТ КИБЕРВОЙНУ ПРОТИВ РОССИИ. И присматривается к Дальнему Востоку

⚡️ Кремль сорвал попытку ареста Путина || Срочная переброска войск НАТО

⚡️ Кремль сорвал попытку ареста Путина || Срочная переброска войск НАТО

RAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

RAG | САМОЕ ПОНЯТНОЕ ОБЪЯСНЕНИЕ!

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Но что такое нейронная сеть? | Глава 1. Глубокое обучение

Историческое решение по Украине / НАТО идёт в наступление

Историческое решение по Украине / НАТО идёт в наступление

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]