Datenanalyse: Bibliothek erweitert Pandas um KI-Schnittstelle
Die unter Datenanalysten beliebte Pandas-Bibliothek kann jetzt mit Large-Language-Modulen genutzt werden. Aktuell funktioniert es mit GPT von Open AI.
Mit Pandas AI wurde die Python-Bibliothek Pandas um eine KI-Funktion erweitert. Pandas ist ein unter Datenanalysten beliebtes Tool, mit dem sich große Tabellen untersuchen und plotten lassen. Pandas AI ersetzt Pandas dabei nicht, sondern kann lediglich in Verbindung mit dieser Bibliothek verwendet und damit dialogfähig gemacht werden.
Pandas AI funktioniert aktuell mit GPT
Neben einfachen Fragen wie "Finde alle Zahlen, die größer sind als x" können auch Fragen gestellt werden, etwa nach dem summierten Bruttoinlandsprodukt der beiden unglücklichsten Länder. Zuvor müssen allerdings, wie üblich, ein DataFrame mit Listen zum Land, dem Bruttoinlandsprodukt und dem "Happiness_index" (country, gdp und happiness_index) eingelesen werden. Um den Prompt zu verstehen, nutzt Pandas AI das Sprachmodell (Large-Language-Modell, LLM) GPT von OpenAI.
import pandas as pd
from pandasai import PandasAI
# Sample DataFrame
df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"gdp": [21400000, 2940000, 2830000, 3870000, 2160000, 1350000, 1780000, 1320000, 516000, 14000000],
"happiness_index": [7.3, 7.2, 6.5, 7.0, 6.0, 6.3, 7.3, 7.3, 5.9, 5.0]
})
# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI()
pandas_ai = PandasAI(llm)
pandas_ai.run(df, prompt='Which are the 5 happiest countries?')
Der Entwickler Gabriele Venturi stellt das Projekt unter MIT-Lizenz auf Github frei zur Verfügung. Für den ebenfalls nötigen OpenAI-API-Zugang können zusätzliche Kosten entstehen.
Venturi fordert andere Entwickler zudem dazu auf, sich an dem Projekt zu beteiligen. So soll Pandas AI künftig auch weitere LLMs unterstützen. Ebenfalls geplant ist eine Webinterface. Wer das Tool lediglich ausprobieren möchte, für den steht ein Jupyter Notebook mit einer Demoversion bereit.
(mack)