unduood's picture
Upload ABSA model for Thai sports/fitness reviews
3e7e4b1 verified
metadata
language:
  - th
license: apache-2.0
tags:
  - sentiment-analysis
  - aspect-based-sentiment-analysis
  - thai
  - wangchanberta
  - sports
  - fitness
  - review
datasets:
  - custom
metrics:
  - f1
  - accuracy
pipeline_tag: text-classification

WangchanBERTa ABSA for Thai Sports/Fitness Reviews

Model Description

โมเดล Aspect-Based Sentiment Analysis (ABSA) สำหรับวิเคราะห์รีวิวธุรกิจสถานกีฬาภาษาไทย

Fine-tuned จาก WangchanBERTa

Aspects (8 categories)

Aspect Thai Name Description
equipment อุปกรณ์ เครื่องออกกำลังกาย อุปกรณ์กีฬา
staff โค้ช/พนักงาน ความรู้ ทักษะการสอน การบริการ
cleanliness ความสะอาด ความสะอาดโดยรวม
atmosphere บรรยากาศ แสงสว่าง อากาศ ความแออัด
price ราคา ค่าบริการ ความคุ้มค่า
location ทำเลที่ตั้ง การเดินทาง ที่จอดรถ
programs คลาส/โปรแกรม ความหลากหลาย ตาราง
amenities สิ่งอำนวยความสะดวก ล็อกเกอร์ ห้องน้ำ

Sentiments

  • none - ไม่ได้พูดถึง
  • positive - เชิงบวก
  • neutral - เป็นกลาง
  • negative - เชิงลบ

Usage

from huggingface_hub import snapshot_download
import torch
import json

# Download model
model_dir = snapshot_download(repo_id="unduood/wangchanberta-absa-sports-facility")

# Load and use (see inference notebook for full example)

Model Architecture

WangchanBERTa (base)
    ↓
[CLS] token embedding (768)
    ↓
Shared Dense Layer (768 → 768)
    ↓
8 Aspect Classification Heads
    ↓
Each: 768 → 384 → 4 (sentiments)

Training

  • Base Model: airesearch/wangchanberta-base-att-spm-uncased
  • Epochs: 5
  • Batch Size: 16
  • Learning Rate: 2e-05
  • Max Length: 256 tokens

Files

  • pytorch_model.bin - Model weights
  • absa_config.json - Model configuration
  • tokenizer_config.json - Tokenizer config
  • sentencepiece.bpe.model - SentencePiece model
  • modeling_absa.py - Model class definition

Limitations

  • ออกแบบมาสำหรับภาษาไทยเท่านั้น
  • เหมาะสำหรับรีวิวธุรกิจสถานกีฬา

License

Apache 2.0