%pip install -q dbc adbc-driver-manager pyarrow

Note: you may need to restart the kernel to use updated packages.

!dbc install -q duckdb

import pyarrow as pa
from adbc_driver_manager import dbapi

connection = dbapi.connect(driver="duckdb", autocommit=True)

cursor = connection.cursor()

cursor.execute("INSTALL ducklake")
cursor.execute("ATTACH 'ducklake:my_ducklake.ducklake' AS my_ducklake;")
cursor.execute("USE my_ducklake;")

<adbc_driver_manager.dbapi.Cursor at 0x10758de80>

cursor.execute("SELECT 1 AS id, 'Alice' AS name")
cursor.fetchone()

(1, 'Alice')

cursor.execute("SELECT 1 AS id, 'Alice' AS name")
cursor.fetch_arrow_table()

pyarrow.Table
id: int32
name: string
----
id: [[1]]
name: [["Alice"]]

cursor.execute("SELECT ? + 1 AS favorite_num", parameters=(10,))
cursor.fetch_arrow_table()

pyarrow.Table
favorite_num: int64
----
favorite_num: [[11]]

table = pa.table({"id": [1, 2, 3, 4], "name": ["Ian", "Matt", "David", "Bryce"]})
cursor.adbc_ingest(table_name="users", data=table, mode="create")

4

table = pa.table({"id": [5, 6], "name": ["Mandy", "Sam"]})
cursor.adbc_ingest(table_name="users", data=table, mode="append")

2

cursor.execute("SELECT * FROM users")
cursor.fetchall()

[(1, 'Ian'), (2, 'Matt'), (3, 'David'), (4, 'Bryce'), (5, 'Mandy'), (6, 'Sam')]

connection.adbc_get_info()

{'vendor_name': 'duckdb',
 'vendor_version': 'v1.5.1',
 'driver_name': 'ADBC DuckDB Driver',
 'driver_version': 'v1.5.1',
 'driver_arrow_version': '(unknown)',
 'driver_adbc_version': 1001000}

info = (
    connection.adbc_get_objects(catalog_filter="my_ducklake", table_name_filter="users")
    .read_all()
    .to_pylist()
)
catalog = info[0]
schema = catalog["catalog_db_schemas"][0]
tables = schema["db_schema_tables"]

tables[0]["table_name"]

'users'

[column["column_name"] for column in tables[0]["table_columns"]]

['id', 'name']

connection.adbc_get_table_schema("users")

id: int64
name: string

cursor.execute("USE memory;")
cursor.execute("DETACH my_ducklake;")

<adbc_driver_manager.dbapi.Cursor at 0x10758de80>

cursor.close()
connection.close()

import os
import shutil

os.remove("my_ducklake.ducklake")
shutil.rmtree("my_ducklake.ducklake.files")

Connect to DuckLake with ADBC in Python

Setup¶

Connection and Cursor¶

Query Execution¶

Bulk Ingestion¶

Metadata¶

Cleanup¶