unduood's picture
Upload ABSA model for Thai sports/fitness reviews
3e7e4b1 verified
---
language:
- th
license: apache-2.0
tags:
- sentiment-analysis
- aspect-based-sentiment-analysis
- thai
- wangchanberta
- sports
- fitness
- review
datasets:
- custom
metrics:
- f1
- accuracy
pipeline_tag: text-classification
---
# WangchanBERTa ABSA for Thai Sports/Fitness Reviews
## Model Description
โมเดล Aspect-Based Sentiment Analysis (ABSA) สำหรับวิเคราะห์รีวิวธุรกิจสถานกีฬาภาษาไทย
Fine-tuned จาก [WangchanBERTa](https://huggingface.co/airesearch/wangchanberta-base-att-spm-uncased)
## Aspects (8 categories)
| Aspect | Thai Name | Description |
|--------|-----------|-------------|
| equipment | อุปกรณ์ | เครื่องออกกำลังกาย อุปกรณ์กีฬา |
| staff | โค้ช/พนักงาน | ความรู้ ทักษะการสอน การบริการ |
| cleanliness | ความสะอาด | ความสะอาดโดยรวม |
| atmosphere | บรรยากาศ | แสงสว่าง อากาศ ความแออัด |
| price | ราคา | ค่าบริการ ความคุ้มค่า |
| location | ทำเลที่ตั้ง | การเดินทาง ที่จอดรถ |
| programs | คลาส/โปรแกรม | ความหลากหลาย ตาราง |
| amenities | สิ่งอำนวยความสะดวก | ล็อกเกอร์ ห้องน้ำ |
## Sentiments
- `none` - ไม่ได้พูดถึง
- `positive` - เชิงบวก
- `neutral` - เป็นกลาง
- `negative` - เชิงลบ
## Usage
```python
from huggingface_hub import snapshot_download
import torch
import json
# Download model
model_dir = snapshot_download(repo_id="unduood/wangchanberta-absa-sports-facility")
# Load and use (see inference notebook for full example)
```
## Model Architecture
```
WangchanBERTa (base)
[CLS] token embedding (768)
Shared Dense Layer (768 → 768)
8 Aspect Classification Heads
Each: 768 → 384 → 4 (sentiments)
```
## Training
- **Base Model**: airesearch/wangchanberta-base-att-spm-uncased
- **Epochs**: 5
- **Batch Size**: 16
- **Learning Rate**: 2e-05
- **Max Length**: 256 tokens
## Files
- `pytorch_model.bin` - Model weights
- `absa_config.json` - Model configuration
- `tokenizer_config.json` - Tokenizer config
- `sentencepiece.bpe.model` - SentencePiece model
- `modeling_absa.py` - Model class definition
## Limitations
- ออกแบบมาสำหรับภาษาไทยเท่านั้น
- เหมาะสำหรับรีวิวธุรกิจสถานกีฬา
## License
Apache 2.0