A▮
ai-archive.ru
1 248 моделей · обновляется ежедневно

Русскоязычные LLM, собранные под ваше железо.

ai-archive.ru — каталог квантизованных языковых моделей, которые реально запускаются дома. Для каждой сборки указан размер на диске, требования к VRAM и совместимые движки инференса. Никакого облака и никаких сюрпризов.

llama.cpp Ollama vLLM LM Studio ExLlamaV2 text-generation-webui Diffusers
1 248
моделей в каталоге
904
GGUF-квантизаций
68
MLX-сборок
152
авторов и команд
2.4M
скачиваний / месяц

Популярное на этой неделе

Модели с самым крутым ростом скачиваний за последние 7 дней.

Все популярные →

Подбор по железу

Выберите ближайший уровень — мы покажем модели, которые комфортно влезут: с реалистичной квантизацией и адекватным контекстным окном.

От каталога — к запущенной модели

Три шага. ai-archive.ru не мешает, а помогает.

01 / поиск

Найдите подходящую модель

Фильтруйте по VRAM, квантизации и движку. Каждая карточка показывает реальный размер на диске и в памяти, а не теоретические максимумы.

ai-archive search "saiga 8b q5"
02 / загрузка

Проверенная закачка

Резюмируемые загрузки с проверкой контрольных сумм. Кэш по хешу: разные кванты одной базы делят блобы на диске.

ai-archive pull IlyaGusev/saiga_llama3_8b-Q5_K_M
03 / запуск

Передайте свой движок

Одна команда поднимает модель с разумными дефолтами под ваше железо. Меняйте движок без перекачки.

ai-archive run --engine llama.cpp --ctx 8192

Модели1 248

Подходит моему железу
Показано 1 – 20 из 1 248