Matryoshka Representation Learning
Paper
• 2205.13147 • Published
• 25
This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-m-v2.0 on the csv dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: GteModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("minhtuan7akp/snowflake-m-v2.0-vietnamese_matryoshka-finetune")
# Run inference
sentences = [
'Gia Cát Lượng đã giúp ai trong việc quản lý nước Thục?',
'phải trông coi mọi việc, giúp Thành Vương đến lúc trưởng thành. \r\n4\r\n Hoắc Quang giữ chức Đại tư mã tướng quân, phò Hán Chiêu Đế lúc lên ngôi mới 9 tuổi. \r\n5\r\n Gia Cát Lượng tức Khổng Minh, là thừa tướng của Chiêu Đế Lưu Bị nước Thục đời Tam Quốc. Lưu Bị chết, con là Lưu Thiện nối \r\nngôi, tức Thục Hậu chúa, mọi việc nước, việc quân đều phải trông cậy vào Gia Cát Lượng. \r\n6\r\n Tô Hiến Thành là Thái úy triều Lý Cao Tông, nhận di mệnh Cao Tông phò vua nhỏ là Long Cán lên nối ngôi mới 3 tuổi. \r\n7\r\n Tứ phụ: nghĩa là bốn viên đại thần giúp vua khi mới lên ngôi. \r\n8\r\n Chỉ Thuận Tông. \r\n9\r\n Xích chủy: nghĩa là mõm đỏ, miệng đỏ, hay đỏ mỏ. Xích chủy hầu là loài đỏ mỏ ám chỉ Lê Quý Ly. \r\n10 Bạch kê: nghĩa là gà trắng. Nghệ Tông sinh năm Tân Dậu, tức năm gà. Tân thuộc hành kim, loài kim sắc trắng. Vì thế "bạch kê" \r\nám chỉ Nghệ Tông. \r\n11 Chữ vương? ở trong lòng chữ khẩu? là chữ "quốc"?. \r\n12 Theo tục nhà Trần, hằng năm vào ngày mồng 4 tháng 4, vua hội họp bề tôi làm lễ tuyên thệ ở đền Đồng Cổ. (Xem bản kỷ, quyển \r\n5, Kiến Trung năm thứ 3, 1277). \r\n13 Chỉ Quý Ly. \r\n288 Đại Việt Sử Ký Toàn Thư - Bản Kỷ - Quyển VIII \r\nQuý Ly bỏ mũ, rập đầu khóc lóc từ tạ, chỉ trời vạch đất thề rằng: \r\n"Nếu thần không biết dốc lòng trung, hết sức giúp Quan gia để truyền đến con cháu về sau thì \r\ntrời sẽ ghét bỏ thần". \r\nQuý Ly lại nói: "Lúc Linh Đức Vương làm điều thất đức, nếu không nhờ oai linh bệ hạ thì thần đã',
'Tây. Ngoài cơ sờ đúc súng cũ của tiên triều, năm 1825 vua Minh \r\nMệnh mờ thêm sáu xưởng nữa. vốn cần cù và ham học hỏi sáng \r\ntạo, những người thợ quân giới đã được "thứ súng tay nạp thuốc nổ \r\nmạnh theo kiểu Tây dương". Vào những năm cuối triều Minh \r\nM ệnh, họ đã đúc 15 cỗ đại pháo X ung tiêu băng đồng và hai cỗ \r\nsúng lớn Chấn hải, loại đại pháo lợi hại trong thủy chiến phương \r\nTây. Sau đó, lại xuất xưởng tiếp 30 cỗ Chấn hải. Năm 1829, quản \r\nkho Hải Dương là Tôn Thất Thiện cùng với 100 lính Chấn cơ chế \r\nra cối gỗ chạy bàng sức nước ở khe suối để giã, luyện thuốc súng. \r\nDụng cụ này là xe "Thủy hỏa ký tế", và những năm sau được phổ \r\ncập trong quân ngũ. Từ vũ khí phương Tây, người Đại Nam đã tự \r\ntìm hiểu từng chi tiết để chế tạo thước đo ngắm bắn, thước kiểm tra \r\nthuốc súng. Trong bảy năm ờ ngôi, vua Thiệu Trị đúc 9 cỗ súng \r\nbàng đồng hiệu là "Thần uy phục viễn đại tướng quân", cỗ to nhất \r\nlà 10.706 cân, cỗ nhỏ nhất là 10.222 cân, tổng cộng là 93.829 cân.\r\n649\r\nLỊCH SỬ VIỆT NAM - TẬP 5\r\nVà ba cỗ súng hiệu "Bảo Đại định công an dân hòa chúng thượng \r\ntướng quân", mỗi cỗ trên 14.500 cân, tổng cộng là 43.620 cân1.\r\nĐe tạo điều kiện cho quân thủy học tập, bộ Công cấp cho họ la \r\nbàn, thước đo nước, đồng hồ cát xem giờ của phương Tây. v ề khoa \r\nmục bắn súng thì lính thủy phải tập bắn súng điểu sang và đại bác. \r\nMinh Mệnh yêu cầu Hiệp biện Đại học sĩ lãnh Thượng thư bộ Binh \r\nTrương Đăng Quế đọc kỹ các sách và bản đồ thủy chiến "Tây',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
snowflake_m_v2.0_768, snowflake_m_v2.0_512, snowflake_m_v2.0_256, snowflake_m_v2.0_128 and snowflake_m_v2.0_64InformationRetrievalEvaluator| Metric | snowflake_m_v2.0_768 | snowflake_m_v2.0_512 | snowflake_m_v2.0_256 | snowflake_m_v2.0_128 | snowflake_m_v2.0_64 |
|---|---|---|---|---|---|
| cosine_accuracy@1 | 0.4114 | 0.4037 | 0.4014 | 0.347 | 0.2927 |
| cosine_accuracy@3 | 0.6219 | 0.6205 | 0.6096 | 0.5626 | 0.4804 |
| cosine_accuracy@5 | 0.6909 | 0.6904 | 0.6813 | 0.6311 | 0.5406 |
| cosine_accuracy@10 | 0.7703 | 0.7598 | 0.7562 | 0.7169 | 0.632 |
| cosine_precision@1 | 0.4114 | 0.4037 | 0.4014 | 0.347 | 0.2927 |
| cosine_precision@3 | 0.2073 | 0.2068 | 0.2032 | 0.1875 | 0.1601 |
| cosine_precision@5 | 0.1382 | 0.1381 | 0.1363 | 0.1262 | 0.1081 |
| cosine_precision@10 | 0.077 | 0.076 | 0.0756 | 0.0717 | 0.0632 |
| cosine_recall@1 | 0.4114 | 0.4037 | 0.4014 | 0.347 | 0.2927 |
| cosine_recall@3 | 0.6219 | 0.6205 | 0.6096 | 0.5626 | 0.4804 |
| cosine_recall@5 | 0.6909 | 0.6904 | 0.6813 | 0.6311 | 0.5406 |
| cosine_recall@10 | 0.7703 | 0.7598 | 0.7562 | 0.7169 | 0.632 |
| cosine_ndcg@10 | 0.5909 | 0.5839 | 0.5794 | 0.5313 | 0.4574 |
| cosine_mrr@10 | 0.5336 | 0.5274 | 0.5228 | 0.4721 | 0.4022 |
| cosine_map@100 | 0.5403 | 0.5345 | 0.5299 | 0.4796 | 0.4108 |
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Tính chất kiến trúc của đình làng triều Mạc được thể hiện qua những đặc điểm gì, như số gian, hình dạng, nội thất và cách bố trí không gian trong công trình? |
Đình làng là công trình kiến trúc công cộng được dựng nên |
băng sự đóng góp của cải và công sức của cả cộng đồng làng xã. |
|
Ngoài chức năng là trụ sở hành chính của cả làng, ngôi đình còn là |
|
trung tâm sinh hoạt văn hóa làng xã, là nơi diễn ra các nghi lễ trọng |
|
đại trong dịp tế lễ thần Thành hoàng làng và tô chức hội hè hăng |
|
năm. Có thê nói, ngôi đình làng là nơi hội tụ sức mạnh của cả cộng |
|
đồng và là biểu trưng đặc sắc nhất của văn hóa làng xã. |
|
Trong các ngôi đình triều Mạc, Thân thành hoàng có lý lịch |
|
xuất thân khá phong phú. Tản Viên sơn thánh là vị thần có ảnh |
|
hưởng lớn ở xứ Đoài được thờ phụng ở đình Tây Đăng, Thanh Lũng |
|
và nhiều làng xã khác. Thần Cao Sơn, Quý Minh tương truyền là |
|
tướng tâm phúc của Hùng Vương được thờ ở đình làng Lỗ Hạnh. |
|
Dân làng Lỗ Hạnh còn thờ cả Phương Dung công chúa... Từ thế |
|
kỷ XYVI và các thế kỷ tiếp sau, Thần thành hoàng làng trở thành |
|
vị vua tỉnh thần ở các làng xã, tín ngưỡng thờ cúng Thân thành |
|
hoàng càng trở nên phong phú thê hiện qua lễ... |
|
Nguyễn Khắc Nhu có vai trò gì trong khởi nghĩa toàn khu vực miền núi Bắc Kỳ của Việt Nam Quốc dân Đảng vào năm 1930? |
bị nổ do bất cẩn. Do đó công việc bị phát hiện. Hai người phụ trách |
cơ quan chế bom là Đỗ Cương và Quản Trác trốn thoát. Nhiều binh |
|
lính và dân thường bị bắt. Công việc bạo động của Xứ Nhu không |
|
thành. Đúng lúc này Việt Nam Quốc dân Đảng vừa thành lập, cử |
|
người tới mời Xứ Nhu và Việt Nam Dân quốc gia nhập Việt Nam |
|
Quốc dân Đảng. Hầu hết các đồng chí của Xứ Nhu trở thành đảng |
|
viên của Việt Nam Quốc dân Đảng ở vùng Bắc Ninh, Bắc Giang. |
|
Do đó, Việt Nam Quốc dân Đảng mạnh lên về số lượng1. Cùng với |
|
việc phát triển đảng viên ở Bẳc Ninh, Bắc Giang, Việt Nam Quốc |
|
dân Đảng còn thiết lập nhiều cơ sở ở các tỉnh Thái Bình, Hải Dương, |
|
1. Nguyễn Khắc Nhu tức Xứ Nhu (1882-1930), người làng Song Khê, huyện |
|
Yên Dũng, tinh Bắc Giang. Với lòng yêu nuớc và ý chí chống Pháp, |
|
ông dự tính thành lập một tổ chức hoạt động công khai nhăm đào tạo |
|
tài năng cho đất nước lấy tên là "Hội Quốc dân dục tài”. Việc này |
|
không thành công, ông lại lập tổ chức bí mật nhăm bạo động lật đổ ách |
|
áp b... |
|
Giá gạo tháng 3-1950 ở Liên khu IV là bao nhiêu đồng/tạ và có chênh lệch gì so với giá gạo ở Liên khu III và Liên khu Việt Bắc? |
ngày càng tăng nhanh, nhất là ở Việt Bắc. Giá gạo tăng mạnh |
nhất, giá thực phẩm cũng tăng dần theo giá gạo. Giá các mặt hàng |
|
kỹ nghệ tăng chậm hơn. Giá hàng ngoại hóa hầu như không tăng |
|
vỉ trong vùng Pháp chiếm đóng, hàng ngoại hóa tính bằng tiền |
|
Đông Dương không tăng, hom nữa nhân dân cũng ít tiêu thụ hàng |
|
ngoại hóa vì bị cấm. |
|
1. Viện Kinh tế học, Kinh tế Việt Nam từ Cách mạng Tháng Tám đến..., Sách |
|
đã dẫn, tr. 238. |
|
2. Chuơng trình và báo cáo của Bộ Kinh tế về tình hình hoạt động năm 1950. |
|
Trung tâm lưu trữ quốc gia in, phông Phủ Thủ tướng, Hồ sơ số 1914. |
|
488 |
|
Chương VI. Việt Nam dân chủ cộng hòa xây dựng.. |
|
Giá gạo trong những tháng đầu năm 1950 so với cuối năm 1949 |
|
có thay đổi, Liên khu IV (Thanh Hóa) giá tăng lên 154%; Liên khu |
|
III (Hà Đông - Hà Nam) giá tăng lên 153%; Liên khu Việt Bắc |
|
(Thái Nguyên) giá tăng lên 800%. |
|
Giá gạo ở Thái Nguyên từ 1.625 đồng/tạ lên 13.000 đồng/tạ |
|
(tăng 800%); ờ Phú Thọ từ 2.650 đồng/tạ lên 7.500 đồng/tạ (tăng |
|
283%). Mặt khác, ... |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
768,
512,
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1,
1,
1
],
"n_dims_per_step": -1
}
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Nguyễn Hoàng đã thực hiện những hành động gì để dần dần tách khỏi sự ràng buộc của họ Trịnh sau khi trở lại Thuận Quảng vào năm 1600, và những hành động này đã ảnh hưởng như thế nào đến mối quan hệ giữa hai dòng họ? |
thẳng đối với họ Nguyễn. Trịnh Tùng đã lấy danh nghĩa vua Lê sai |
sứ giả là Thiêm đô ngự sử Lê Nghĩa Trạch đem sắc vào phủ dụ |
|
Nguyễn Hoàng và vẫn cho ở lại trấn thủ, hằng năm nộp thuế như |
|
cũ. Cùng với sắc của vua Lê, Trịnh Tùng có gửi thư kèm theo |
|
Chương ĩ. Sự phân liệt Đàng Trong - Đàng Ngoài... |
|
1, Toàn thư. quyển 17, tập IV, Sđd, tr. 200. |
|
2, Đại Nam thực lục, Tiền biên, quyển 1, tập I, Sđd, tr. 34. |
|
3, Đại Nam thực lục, Tiển biên, quyển 1, tập I, Sđd, tr. 35. |
|
39 |
|
LỊCH SỬ VIỆT NAM - TẬP 4 |
|
"khuyên giữ việc thuế cống". Nguyễn Hoàng sai sứ giả đáp lễ tạ on |
|
vua Lê và gửi thư cho Trịnh Tùng hẹn kết nghĩa thông gia, đem con |
|
gái là Ngọc Tú gả cho Trịnh Tráng (con Trịnh Tùng) lấy danh |
|
nghĩa hôn nhân để duy trì mối quan hệ bề ngoài giao hảo giữa hai |
|
dòng họ vốn có sẵn một mối thù địch. |
|
- Chính sách cùa họ Nguyễn từ khi Nguyễn Hoàng trở lại |
|
Thuận Quảng |
|
Năm 1600, Nguyễn Hoàng ròi được khỏi đất Bẳc trở về Thuận |
|
Quảng bắt đầu thực hiện một chính sách cai trị mói, dần dần tác... |
|
Báo cáo của Ủy ban Kháng chiến hành chính Hà Nội về hoạt động giáo dục bù nhìn và tình hình các giáo sư trường Chu Văn An có nội dung gì? |
Tài liệu tham khảo |
21. Báo cáo sô' 2 BC/I ngày 12-11-1949 và Báo cáo sô' 463 |
|
BC/DB ngày 25-12-1949 của Ty Công an H à Nội. Trung |
|
tâm Lưu trữ Quốc gia III, phông Phủ Thủ tướng, Hồ sơ |
|
SỐ921. |
|
28. Báo “Le song” ngày 11-2-1949. Trung tâm Lưu trữ Quốc |
|
gia III, phông Phủ Thủ tướng, Hồ sơ sô' 2002. |
|
29. Báo cáo của u ỷ ban Kháng chiến hành chính Hà Nội vê |
|
hoạt động giáo dục bù nhìn và tình hình các giáo sư |
|
trường Chu Văn An. Trung tâm Lưu trữ Quốc gia III, |
|
phông Phủ Thủ tướng, Hồ sơ số 979. |
|
30. Báo cáo của Tổng Giám đốc Việt N am Công an vụ sô' |
|
122/NCB3 ngày 1-4-1951. Trung tâm Lưu trữ Quốic gia |
|
III, phông Phủ Thủ tướng, Hồ sơ sô' 979. |
|
31. Báo cáo thành tích về cống tác công an trong 8 năm kháng |
|
chiến (1946-1954) của Bộ Công an. Trung tâm Lưu trữ |
|
Quốc gia III, phông Phủ Thủ tướng, Hồ sơ sô' 927. |
|
32. Báo cáo một năm kháng chiến (12-1946 đến 12-1947) của |
|
UBKCHC Khu 12. Trung tâm Lưu trữ Quốc gia III, phông |
|
Phủ Thủ tướng, Hồ sơ sô" 2000. |
|
33. Báo cáo thành tích quăn sự trong 8 n... |
|
Đặc điểm dân số của nước ta ảnh hưởng đến các ngành dịch vụ như thế nào và đòi hỏi những ngành dịch vụ nào cần được ưu tiên phát triển trong quá trình đô thị hóa? |
— Trong các thành phố lớn thường hình thành các trung tâm giao dịch, |
thương mại. Đó là nơi tập trung các ngân hàng, các văn phòng đại diện |
|
của các công ti, các siêu thị hay các tổ hợp thương mại, dịch vụ lớn... |
|
Ở các thành phố lớn trên thế giới, thường dễ nhận thấy các trung tâm |
|
thương mại này do sự tập trung các ngôi nhà cao tầng, chọc trời. Một |
|
thành phố có thể có trung tâm thương mại chính và một số trung tâm |
|
thương mại nhỏ hơn, kết quả của sự phát triển đô thị. |
|
— Ở nước ta, các thành phố, thị xã thường có khu hành chính (phân |
|
“đô”) và khu buôn bán, dịch vụ (phân “thị'). Ở Hà Nội, Thành phố |
|
Hồ Chí Minh các trung tâm giao dịch, thương mại của thành phố đang |
|
được hình thành rõ nét. |
|
CÂU HỎI VÀ BÀI TẬP |
|
174 |
|
1. Cho biết đặc điểm dân số của nước ta (đông, tăng còn tương đối |
|
nhanh, mức sống đang nâng lên và đô thị hoá đang phát triển với |
|
tốc độ nhanh hơn) có ảnh hưởng đến các ngành dịch vụ như thế |
|
nào ? Các đặc điểm đó đòi hỏi những ngành dịch vụ nào cần được |
|
ưu tiê... |
MatryoshkaLoss with these parameters:{
"loss": "MultipleNegativesRankingLoss",
"matryoshka_dims": [
768,
512,
256,
128,
64
],
"matryoshka_weights": [
1,
1,
1,
1,
1
],
"n_dims_per_step": -1
}
eval_strategy: stepsper_device_train_batch_size: 6per_device_eval_batch_size: 6learning_rate: 3e-06num_train_epochs: 2warmup_ratio: 0.05bf16: Truebatch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 6per_device_eval_batch_size: 6per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 3e-06weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 2max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.05warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Truefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportional| Epoch | Step | Training Loss | Validation Loss | snowflake_m_v2.0_768_cosine_ndcg@10 | snowflake_m_v2.0_512_cosine_ndcg@10 | snowflake_m_v2.0_256_cosine_ndcg@10 | snowflake_m_v2.0_128_cosine_ndcg@10 | snowflake_m_v2.0_64_cosine_ndcg@10 |
|---|---|---|---|---|---|---|---|---|
| 0.0305 | 100 | 1.7876 | 1.1904 | 0.4785 | 0.4705 | 0.4505 | 0.3318 | 0.2179 |
| 0.0609 | 200 | 1.3408 | 0.8115 | 0.5106 | 0.4999 | 0.4862 | 0.3923 | 0.2731 |
| 0.0914 | 300 | 0.8536 | 0.6208 | 0.5323 | 0.5265 | 0.5109 | 0.4285 | 0.3178 |
| 0.1218 | 400 | 0.6425 | 0.5241 | 0.5477 | 0.5366 | 0.5248 | 0.4483 | 0.3441 |
| 0.1523 | 500 | 0.5621 | 0.4878 | 0.5542 | 0.5406 | 0.5354 | 0.4625 | 0.3625 |
| 0.1827 | 600 | 0.5521 | 0.4712 | 0.5566 | 0.5471 | 0.5392 | 0.4715 | 0.3735 |
| 0.2132 | 700 | 0.5387 | 0.4529 | 0.5623 | 0.5534 | 0.5438 | 0.4803 | 0.3856 |
| 0.2436 | 800 | 0.5439 | 0.4324 | 0.5619 | 0.5526 | 0.5473 | 0.4807 | 0.3895 |
| 0.2741 | 900 | 0.3761 | 0.4220 | 0.5627 | 0.5553 | 0.5499 | 0.4829 | 0.3912 |
| 0.3045 | 1000 | 0.4978 | 0.4020 | 0.5696 | 0.5591 | 0.5527 | 0.4872 | 0.3990 |
| 0.3350 | 1100 | 0.5307 | 0.3927 | 0.5723 | 0.5620 | 0.5589 | 0.4948 | 0.4042 |
| 0.3654 | 1200 | 0.4942 | 0.3823 | 0.5740 | 0.5650 | 0.5630 | 0.5001 | 0.4116 |
| 0.3959 | 1300 | 0.3628 | 0.3754 | 0.5724 | 0.5644 | 0.5613 | 0.4992 | 0.4131 |
| 0.4263 | 1400 | 0.3592 | 0.3584 | 0.5776 | 0.5699 | 0.5624 | 0.5065 | 0.4181 |
| 0.4568 | 1500 | 0.3938 | 0.3521 | 0.5755 | 0.5696 | 0.5627 | 0.5081 | 0.4250 |
| 0.4872 | 1600 | 0.4694 | 0.3486 | 0.5762 | 0.5705 | 0.5630 | 0.5076 | 0.4238 |
| 0.5177 | 1700 | 0.4115 | 0.3561 | 0.5727 | 0.5673 | 0.5616 | 0.5064 | 0.4265 |
| 0.5481 | 1800 | 0.4144 | 0.3371 | 0.5768 | 0.5723 | 0.5649 | 0.5078 | 0.4256 |
| 0.5786 | 1900 | 0.3783 | 0.3334 | 0.5758 | 0.5703 | 0.5638 | 0.5082 | 0.4264 |
| 0.6090 | 2000 | 0.3374 | 0.3302 | 0.5790 | 0.5710 | 0.5661 | 0.5099 | 0.4276 |
| 0.6395 | 2100 | 0.41 | 0.3168 | 0.5817 | 0.5769 | 0.5694 | 0.5164 | 0.4280 |
| 0.6699 | 2200 | 0.4752 | 0.3138 | 0.5826 | 0.5779 | 0.5703 | 0.5156 | 0.4318 |
| 0.7004 | 2300 | 0.2697 | 0.3130 | 0.5837 | 0.5786 | 0.5712 | 0.5178 | 0.4350 |
| 0.7308 | 2400 | 0.4127 | 0.3075 | 0.5826 | 0.5768 | 0.5700 | 0.5153 | 0.4308 |
| 0.7613 | 2500 | 0.3481 | 0.3083 | 0.5842 | 0.5787 | 0.5719 | 0.5182 | 0.4345 |
| 0.7917 | 2600 | 0.329 | 0.2987 | 0.5871 | 0.5828 | 0.5761 | 0.5224 | 0.4350 |
| 0.8222 | 2700 | 0.4066 | 0.2929 | 0.5854 | 0.5796 | 0.5739 | 0.5187 | 0.4366 |
| 0.8526 | 2800 | 0.3523 | 0.2912 | 0.5872 | 0.5791 | 0.5737 | 0.5164 | 0.4403 |
| 0.8831 | 2900 | 0.2931 | 0.2938 | 0.5849 | 0.5773 | 0.5730 | 0.5193 | 0.4401 |
| 0.9135 | 3000 | 0.3608 | 0.2868 | 0.5841 | 0.5769 | 0.5746 | 0.5198 | 0.4405 |
| 0.9440 | 3100 | 0.4988 | 0.2825 | 0.5857 | 0.5790 | 0.5769 | 0.5239 | 0.4436 |
| 0.9744 | 3200 | 0.379 | 0.2772 | 0.5893 | 0.5809 | 0.5780 | 0.5240 | 0.4434 |
| 1.0049 | 3300 | 0.2685 | 0.2730 | 0.5891 | 0.5794 | 0.5784 | 0.5257 | 0.4438 |
| 1.0353 | 3400 | 0.3269 | 0.2679 | 0.5906 | 0.5820 | 0.5794 | 0.5268 | 0.4443 |
| 1.0658 | 3500 | 0.2561 | 0.2672 | 0.5907 | 0.5828 | 0.5789 | 0.5286 | 0.4470 |
| 1.0962 | 3600 | 0.2696 | 0.2663 | 0.5930 | 0.5840 | 0.5799 | 0.5270 | 0.4464 |
| 1.1267 | 3700 | 0.2973 | 0.2674 | 0.5910 | 0.5829 | 0.5775 | 0.5281 | 0.4475 |
| 1.1571 | 3800 | 0.2717 | 0.2675 | 0.5884 | 0.5802 | 0.5769 | 0.5276 | 0.4493 |
| 1.1876 | 3900 | 0.2932 | 0.2615 | 0.5894 | 0.5812 | 0.5791 | 0.5285 | 0.4527 |
| 1.2180 | 4000 | 0.3191 | 0.2597 | 0.5902 | 0.5831 | 0.5771 | 0.5280 | 0.4521 |
| 1.2485 | 4100 | 0.2936 | 0.2583 | 0.5903 | 0.5831 | 0.5792 | 0.5280 | 0.4517 |
| 1.2789 | 4200 | 0.2266 | 0.2609 | 0.5879 | 0.5814 | 0.5764 | 0.5276 | 0.4547 |
| 1.3094 | 4300 | 0.2712 | 0.2606 | 0.5895 | 0.5818 | 0.5784 | 0.5269 | 0.4546 |
| 1.3398 | 4400 | 0.3014 | 0.2609 | 0.5898 | 0.5815 | 0.5772 | 0.5278 | 0.4551 |
| 1.3703 | 4500 | 0.2104 | 0.2607 | 0.5892 | 0.5815 | 0.5771 | 0.5268 | 0.4548 |
| 1.4007 | 4600 | 0.4204 | 0.2614 | 0.5881 | 0.5812 | 0.5757 | 0.5270 | 0.4551 |
| 1.4312 | 4700 | 0.2502 | 0.2614 | 0.5894 | 0.5801 | 0.5773 | 0.5288 | 0.4551 |
| 1.4616 | 4800 | 0.171 | 0.2605 | 0.5892 | 0.5805 | 0.5777 | 0.5306 | 0.4582 |
| 1.4921 | 4900 | 0.2284 | 0.2625 | 0.5881 | 0.5816 | 0.5771 | 0.5297 | 0.4574 |
| 1.5225 | 5000 | 0.2021 | 0.2597 | 0.5897 | 0.5814 | 0.5785 | 0.5294 | 0.4572 |
| 1.5530 | 5100 | 0.3218 | 0.2596 | 0.5900 | 0.5826 | 0.5783 | 0.5301 | 0.4575 |
| 1.5834 | 5200 | 0.2402 | 0.2586 | 0.5894 | 0.5821 | 0.5788 | 0.5290 | 0.4581 |
| 1.6139 | 5300 | 0.3036 | 0.2562 | 0.5910 | 0.5825 | 0.5780 | 0.5311 | 0.4576 |
| 1.6443 | 5400 | 0.2906 | 0.2558 | 0.5903 | 0.5822 | 0.5795 | 0.5301 | 0.4578 |
| 1.6748 | 5500 | 0.2319 | 0.2553 | 0.5901 | 0.5829 | 0.5785 | 0.5311 | 0.4583 |
| 1.7052 | 5600 | 0.2315 | 0.2544 | 0.5896 | 0.5821 | 0.5775 | 0.5313 | 0.4581 |
| 1.7357 | 5700 | 0.2448 | 0.2541 | 0.5897 | 0.5831 | 0.5783 | 0.5310 | 0.4573 |
| 1.7661 | 5800 | 0.1683 | 0.2533 | 0.5906 | 0.5840 | 0.5785 | 0.5307 | 0.4576 |
| 1.7966 | 5900 | 0.2424 | 0.2536 | 0.5913 | 0.5841 | 0.5783 | 0.5312 | 0.4585 |
| 1.8270 | 6000 | 0.2169 | 0.2539 | 0.5905 | 0.5832 | 0.5787 | 0.5305 | 0.4574 |
| 1.8575 | 6100 | 0.2504 | 0.2541 | 0.5918 | 0.5830 | 0.5780 | 0.5306 | 0.4575 |
| 1.8879 | 6200 | 0.1923 | 0.2540 | 0.5908 | 0.5841 | 0.5781 | 0.5309 | 0.4585 |
| 1.9184 | 6300 | 0.2375 | 0.2533 | 0.5904 | 0.5839 | 0.5790 | 0.5306 | 0.4581 |
| 1.9488 | 6400 | 0.2248 | 0.2529 | 0.5904 | 0.5844 | 0.5777 | 0.5316 | 0.4577 |
| 1.9793 | 6500 | 0.1819 | 0.2532 | 0.5909 | 0.5839 | 0.5794 | 0.5313 | 0.4574 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
Snowflake/snowflake-arctic-embed-m-v2.0