GitHub

Короткие примеры запуска (рекомендации) Быстро протестировать на 10k, профилируя:

python test_embeddings_with_safe_backups.py --target 10000 --fetch-batch-size 1000 --encode-batch-size 512 --global-chunk-batch 4096 --backup-chunk-size 10000 --insert-batch-size 1000 --use-fp16 --profile --normalize

Если хочется безопасно пробовать большой encode:

python test_embeddings_with_safe_backups.py --target 200000 --fetch-batch-size 1000 --encode-batch-size 1024 --global-chunk-batch 8192 --use-fp16 --backup-chunk-size 10000 --insert-batch-size 1000 --normalize

(скрипт уменьшит encode_batch_size или global_chunk_batch при OOM автоматически).

Что ожидать и мониторить при global_chunk_batch=4096 и encode_batch_size=512 ожидаемый рост throughput — модель будет грузиться эффективнее; VRAM usage заметно вырастет (проверь nvidia-smi).

если видишь CUDA OOM — скрипт автоматически уменьшит параметры; также можно вручную уменьшить global_chunk_batch на 2×.

следи за docker logs library-manticore и за free -h / df -h — вставки в Manticore и сегментирование могут использовать RAM/disk.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
__pycache__		__pycache__
.gitignore		.gitignore
README.md		README.md
eval_precision_at_k.py		eval_precision_at_k.py
progress.json		progress.json
self_retrieval_test.py		self_retrieval_test.py
test_embeddings.py		test_embeddings.py
test_embeddings_with_safe_backups.py		test_embeddings_with_safe_backups.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

About

Uh oh!

Releases

Packages

Languages

terratensor/py_embeddings

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages