SQL con Python es el patrón estándar en ciencia de datos: el motor responde preguntas de conjunto; Python profundiza en modelado y visualización.
Conexión desde Python
Usa drivers según el motor (por ejemplo psycopg2 para PostgreSQL o conectores oficiales). Parametriza valores para evitar inyección SQL.
pandas y read_sql
import pandas as pd
import sqlalchemy as sa
engine = sa.create_engine("postgresql+psycopg2://usuario:clave@localhost/ventas")
df = pd.read_sql(
"SELECT cliente_id, SUM(importe) AS total FROM pedidos GROUP BY cliente_id",
engine,
)
Buenas prácticas
- Agrega y filtra en SQL todo lo posible.
- Documenta consultas largas en archivos
.sqlversionados. - Limita columnas y filas antes de cargar en memoria.