Initial version

Files changed (5) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+model.sqlite filter=lfs diff=lfs merge=lfs -text
+vocab.json filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

+---
+tags:
+- sentence-similarity
+inference: false
+license: apache-2.0
+language: en
+library_name: staticvectors
+base_model:
+- NeuML/word2vec
+---
+# Word2Vec StaticVectors model
+This model is an export of these [Word2Vec Vectors](https://code.google.com/archive/p/word2vec/) for [`staticvectors`](https://github.com/neuml/staticvectors). `staticvectors` enables running inference in Python with NumPy. This helps it maintain solid runtime performance.
+_This model is a quantized version of the base model. It's using 10x256 Product Quantization._
+## Usage with StaticVectors
+```python
+from staticvectors import StaticVectors
+model = StaticVectors("neuml/word2vec")
+model.embeddings(["word"])
+```
+Given that pre-trained embeddings models can get quite large, there is also a SQLite version that lazily loads vectors.
+```python
+from staticvectors import StaticVectors
+model = StaticVectors("neuml/word2vec/model.sqlite")
+model.embeddings(["word"])
+```

config.json ADDED Viewed

+{
+  "model_type": "staticvectors",
+  "storage": "safetensors",
+  "format": "text",
+  "source": "GoogleNews-vectors-negative300.txt",
+  "total": 3000000,
+  "dim": 300
+}

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bba9a7b3e81279a7d475ac3a7c94fe75c1594c552120dc92144be87555c5e031
+size 30307440

vocab.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:80eee12aacfcf214f386f2073eb2a2a5b4e385c260b9670a9bb7fc8a8dbced7f
+size 79304287