Building on HF

Krishna Teja Chitty-Venkata

krishnateja95

https://krishnateja95.github.io/

AI & ML interests

LLM Optimization, Neural Architecture Search, Quantization, Pruning

Recent Activity

updated a model about 8 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-block

updated a model about 9 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Instruct-FP8-block

updated a model about 9 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Instruct-quantized.w4a16

View all activity

Organizations

updated a model about 8 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-block

Text Generation • 80B • Updated about 8 hours ago • 40

updated 5 models about 9 hours ago

updated a model about 10 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-dynamic

Text Generation • 80B • Updated about 10 hours ago • 72

updated a model 5 days ago

RedHatAI/Qwen3-8B-FP8-block

Text Generation • 8B • Updated 5 days ago • 120

updated a model 10 days ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-quantized.w4a16

Updated 10 days ago • 47

updated a collection 12 days ago

Qwen3-Next-80B-A3B Quantized Models

Collection

FP8-dynamic, FP8-block, NVFP4, INT4, INT8 versions of Qwen3-Next-80B-A3B-Instruct and Qwen3-Next-80B-A3B-Thinking Models • 8 items • Updated about 10 hours ago

published 5 models 12 days ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated about 9 hours ago • 22

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-dynamic

Text Generation • 80B • Updated about 10 hours ago • 72

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-block

Text Generation • 80B • Updated about 8 hours ago • 40

inference-optimization/Qwen3-Next-80B-A3B-Thinking-quantized.w4a16

Updated 10 days ago • 47

inference-optimization/Qwen3-Next-80B-A3B-Thinking-quantized.w8a8

Updated 12 days ago

updated a model 13 days ago

RedHatAI/Qwen3-Next-80B-A3B-Instruct-FP8-dynamic

Text Generation • 80B • Updated 13 days ago • 94

Krishna Teja Chitty-Venkata

AI & ML interests

Recent Activity

Organizations

krishnateja95's activity