Nessun risultato. Prova con un altro termine.
Guide
Notizie
Software
Tutorial

Microsoft lancia tool Python per convertire file Office in Markdown

La nuova libreria MarkItDown di Microsoft supporta anche altri tipi di file, come ad esempio PDF, immagini, audio e HTML.
Microsoft lancia tool Python per convertire file Office in Markdown
La nuova libreria MarkItDown di Microsoft supporta anche altri tipi di file, come ad esempio PDF, immagini, audio e HTML.
Link copiato negli appunti

Markdown è un linguaggio di markup leggero e popolare con sintassi di formattazione del testo semplice, progettato per essere facile da leggere, scrivere e comprendere. Markdown semplifica l'analisi e la comprensione della struttura del testo da parte degli algoritmi AI grazie alla sua sintassi coerente e prevedibile. È inoltre ampiamente supportato da strumenti popolari, tra cui GitHub, Jupyter notebook e altro ancora. Microsoft ha recentemente rilasciato uno strumento open source chiamato MarkItDown su GitHub. Si tratta di una libreria Python per convertire file e documenti di Office in Markdown. I file convertiti possono quindi essere utilizzati per l'indicizzazione, l'analisi del testo e altro ancora. La libreria MarkItDown di Microsoft supporta attualmente diversi formati di file. Questi includono PDF, PowerPoint, Word, Excel, immagini (metadati EXIF ​​e OCR), audio (metadati EXIF ​​e trascrizione vocale), HTML e altri formati basati su testo (csv, json, xml, ecc.).

Microsoft: libreria MarkItDown open source, ma necessario includere la licenza originale

Gli sviluppatori possono configurare la libreria MarkItDown per usare Large Language Models per descrivere le immagini. Per fare ciò, gli utenti dovranno impostare i parametri mlm_client e mlm_model sull'oggetto MarkItDown. Basterà inserire i dati riportati di seguito (senza le virgole e con ogni parametro a capo): from markitdown import MarkItDown, from openai import OpenAI, client = OpenAI(), md = MarkItDown(mlm_client=client, mlm_model="gpt-4o"), result = md.convert("example.jpg"), print(result.text_content).

Poiché la libreria MarkItDown di Microsoft è disponibile con licenza open source MIT, gli sviluppatori possono utilizzarla, modificarla e distribuirla liberamente. L'unico requisito è che venga inclusa la licenza originale e l'avviso di copyright nella loro distribuzione. Gli sviluppatori possono già scaricare la libreria MarkItDown Python dal sito ufficiale. È inoltre possibile installarla usando il comando "pip install markitdown" o dalla fonte usando il comando "pip install -e". Gli utenti “non sviluppatori” che desiderano provare MarkItDown, possono accedere alla libreria in versione web app, grazie al sito dedicato.

Ti consigliamo anche