| | --- |
| | language: |
| | - th |
| | license: apache-2.0 |
| | tags: |
| | - sentiment-analysis |
| | - aspect-based-sentiment-analysis |
| | - thai |
| | - wangchanberta |
| | - sports |
| | - fitness |
| | - review |
| | datasets: |
| | - custom |
| | metrics: |
| | - f1 |
| | - accuracy |
| | pipeline_tag: text-classification |
| | --- |
| | |
| | # WangchanBERTa ABSA for Thai Sports/Fitness Reviews |
| |
|
| | ## Model Description |
| |
|
| | โมเดล Aspect-Based Sentiment Analysis (ABSA) สำหรับวิเคราะห์รีวิวธุรกิจสถานกีฬาภาษาไทย |
| |
|
| | Fine-tuned จาก [WangchanBERTa](https://huggingface.co/airesearch/wangchanberta-base-att-spm-uncased) |
| |
|
| | ## Aspects (8 categories) |
| |
|
| | | Aspect | Thai Name | Description | |
| | |--------|-----------|-------------| |
| | | equipment | อุปกรณ์ | เครื่องออกกำลังกาย อุปกรณ์กีฬา | |
| | | staff | โค้ช/พนักงาน | ความรู้ ทักษะการสอน การบริการ | |
| | | cleanliness | ความสะอาด | ความสะอาดโดยรวม | |
| | | atmosphere | บรรยากาศ | แสงสว่าง อากาศ ความแออัด | |
| | | price | ราคา | ค่าบริการ ความคุ้มค่า | |
| | | location | ทำเลที่ตั้ง | การเดินทาง ที่จอดรถ | |
| | | programs | คลาส/โปรแกรม | ความหลากหลาย ตาราง | |
| | | amenities | สิ่งอำนวยความสะดวก | ล็อกเกอร์ ห้องน้ำ | |
| |
|
| | ## Sentiments |
| |
|
| | - `none` - ไม่ได้พูดถึง |
| | - `positive` - เชิงบวก |
| | - `neutral` - เป็นกลาง |
| | - `negative` - เชิงลบ |
| |
|
| | ## Usage |
| |
|
| | ```python |
| | from huggingface_hub import snapshot_download |
| | import torch |
| | import json |
| | |
| | # Download model |
| | model_dir = snapshot_download(repo_id="unduood/wangchanberta-absa-sports-facility") |
| | |
| | # Load and use (see inference notebook for full example) |
| | ``` |
| |
|
| | ## Model Architecture |
| |
|
| | ``` |
| | WangchanBERTa (base) |
| | ↓ |
| | [CLS] token embedding (768) |
| | ↓ |
| | Shared Dense Layer (768 → 768) |
| | ↓ |
| | 8 Aspect Classification Heads |
| | ↓ |
| | Each: 768 → 384 → 4 (sentiments) |
| | ``` |
| |
|
| | ## Training |
| |
|
| | - **Base Model**: airesearch/wangchanberta-base-att-spm-uncased |
| | - **Epochs**: 5 |
| | - **Batch Size**: 16 |
| | - **Learning Rate**: 2e-05 |
| | - **Max Length**: 256 tokens |
| |
|
| | ## Files |
| |
|
| | - `pytorch_model.bin` - Model weights |
| | - `absa_config.json` - Model configuration |
| | - `tokenizer_config.json` - Tokenizer config |
| | - `sentencepiece.bpe.model` - SentencePiece model |
| | - `modeling_absa.py` - Model class definition |
| |
|
| | ## Limitations |
| |
|
| | - ออกแบบมาสำหรับภาษาไทยเท่านั้น |
| | - เหมาะสำหรับรีวิวธุรกิจสถานกีฬา |
| |
|
| | ## License |
| |
|
| | Apache 2.0 |
| |
|