RapidFire AI acelera fine-tuning TRL hasta 20×

Cargando...

RapidFire AI acelera fine-tuning TRL hasta 20× | Keryc

pip install rapidfireai
# Autenticar con Hugging Face
huggingface-cli login --token YOUR_TOKEN
# (workaround si aplica)
pip uninstall -y hf-xet
# Inicializar y arrancar
rapidfireai init
rapidfireai start

from rapidfireai import Experiment
from rapidfireai.automl import List, RFGridSearch, RFModelConfig, RFLoraConfig, RFSFTConfig
from datasets import load_dataset
from transformers import AutoModelForCausalLM, AutoTokenizer

dataset = load_dataset('bitext/Bitext-customer-support-llm-chatbot-training-dataset')
train_dataset = dataset['train'].select(range(128)).shuffle(seed=42)

def formatting_function(row):
    return {
        'prompt': [
            {'role': 'system', 'content': 'You are a helpful customer support assistant.'},
            {'role': 'user', 'content': row['instruction']},
        ],
        'completion': [{'role': 'assistant', 'content': row['response']}]
    }

dataset = dataset.map(formatting_function)

config_set = List([
    RFModelConfig(
        model_name='TinyLlama/TinyLlama-1.1B-Chat-v1.0',
        peft_config=RFLoraConfig(r=8, lora_alpha=16, target_modules=['q_proj', 'v_proj']),
        training_args=RFSFTConfig(learning_rate=1e-3, max_steps=128, fp16=True),
    ),
    RFModelConfig(
        model_name='TinyLlama/TinyLlama-1.1B-Chat-v1.0',
        peft_config=RFLoraConfig(r=32, lora_alpha=64, target_modules=['q_proj', 'v_proj']),
        training_args=RFSFTConfig(learning_rate=1e-4, max_steps=128, fp16=True),
        formatting_func=formatting_function,
    )
])

experiment = Experiment(experiment_name='sft-comparison')
config_group = RFGridSearch(configs=config_set, trainer_type='SFT')

def create_model(model_config):
    model = AutoModelForCausalLM.from_pretrained(
        model_config['model_name'],
        device_map='auto', torch_dtype='auto'
    )
    tokenizer = AutoTokenizer.from_pretrained(model_config['model_name'])
    return (model, tokenizer)

experiment.run_fit(config_group, create_model, train_dataset, num_chunks=4, seed=42)
experiment.end()

Qué trae la integración RapidFire AI + TRL

Cómo funciona por debajo (técnico, pero claro)

Por qué esto da un salto de 10x-20x en práctica

Ejemplo rápido de instalación y uso

Benchmarks y números concretos

Recomendaciones y límites prácticos

Impacto para equipos y startups

Conclusión

Fuente original

¡Mantente al día!

RapidFire AI acelera fine-tuning TRL hasta 20×