0.10.1 (2024-02-05)
Новые возможности
- Добавлена поддержка
Incremental Strategiesдля подключенияKafka:
reader = DBReader(
connection=Kafka(...),
source="topic_name",
hwm=DBReader.AutoDetectHWM(name="some_hwm_name", expression="offset"),
)
with IncrementalStrategy():
df = reader.run()
Использование этой стратегии позволяет возобновить чтение данных из топика Kafka, начиная с последнего зафиксированного смещения. (#202)
-
Добавлены методы
has_data,raise_if_no_dataв классDBReader. (#203) -
Обновлен коннектор VMware Greenplum с
2.1.4до2.3.0. Что предоставляет: - Поддержку Greenplum 7.x
- Поддержку Kubernetes
- Новую опцию чтения gpdb.matchDistributionPolicy которая позволяет сопоставить каждый Spark executor с определенным сегментом Greenplum, избегая избыточной передачи данных между сегментами Greenplum
-
Возможность переопределять параметры оптимизатора Greenplum в операциях чтения/записи (#208)
-
Метод
Greenplum.get_packages()теперь принимает необязательный аргументpackage_version, который позволяет переопределить версию пакета коннектора Greenplum. (#208)