Xenova/llama-68m at main

llama-68m / onnx

2.04 GB

2 contributors

History: 3 commits

Xenova HF Staff

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1)

1fb7da2 verified 3 months ago

decoder_model.onnx

273 MB
xet

Upload folder using huggingface_hub about 2 years ago
decoder_model_fp16.onnx

137 MB
xet

Upload fp16 ONNX weights over 1 year ago
decoder_model_merged.onnx

274 MB
xet

Upload folder using huggingface_hub about 2 years ago
decoder_model_merged_quantized.onnx

70.4 MB
xet

Upload folder using huggingface_hub about 2 years ago
decoder_model_quantized.onnx

69.2 MB
xet

Upload folder using huggingface_hub about 2 years ago
decoder_with_past_model.onnx

273 MB
xet

Upload folder using huggingface_hub about 2 years ago
decoder_with_past_model_quantized.onnx

69.2 MB
xet

Upload folder using huggingface_hub about 2 years ago
model.onnx

274 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago
model_bnb4.onnx

124 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago
model_fp16.onnx

137 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago
model_int8.onnx

69.2 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago
model_q4.onnx

127 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago
model_q4f16.onnx

74.2 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago
model_uint8.onnx

69.2 MB
xet

Add/update the quantized ONNX model files and README.md for Transformers.js v3 (#1) 3 months ago