RetroSearch Browse

Home - News ( United States | United Kingdom | Italy | Germany ) - Football scores

Showing content from https://github.com/derekdqc/adversarialTextCNN below:

GitHub - derekdqc/adversarialTextCNN

基于中文文本分类TextCNN方法，将图像领域的对抗训练技术应用到文本分类任务中。

数据以字为单位输入模型，预训练词向量使用搜狗新闻 Word+Character 300d，点这里下载

python 3.7 pytorch 1.1 tqdm sklearn tensorboardX

THUCNews 数据集划分：

数据集数据量（机器限制，条件允许可使用更大数据集实验）训练集 12800 验证集 1280 测试集 1280

    def train_against(against, model, trains, labels):
        if against == "fgm":
            fgm_against(model, trains, labels)
        elif against == "pgd":
            pgd_against(model, trains, labels)
        elif against == "freeAT":
            freeAT_against(model, trains, labels)

    def fgm_against(model, trains, labels):
        fgm = FGM(model)
        fgm.attack(1, "embedding.weight")  # 在embedding上添加对抗扰动
        outputs = model(trains)
        loss_adv = F.cross_entropy(outputs, labels)
        loss_adv.backward()  # 反向传播，并在正常的grad基础上，累加对抗训练的梯度
        fgm.restore("embedding.weight")  # 恢复embedding参数

    def pgd_against(model, trains, labels):
        pgd = PGD(model)
        K = 3
        # 对抗训练
        pgd.backup_grad()
        for t in range(K):
            pgd.attack(is_first_attack=(t == 0), emb_name="embedding.weight")  # 在embedding上添加对抗扰动, first attack时备份param.data
            if t != K - 1:
                model.zero_grad()
            else:
                pgd.restore_grad()
            outputs = model(trains)
            loss_adv = F.cross_entropy(outputs, labels)
            loss_adv.backward()  # 反向传播，并在正常的grad基础上，累加对抗训练的梯度
        pgd.restore(emb_name="embedding.weight")  # 恢复embedding参数

    def freeAT_against(model, trains, labels):
        free = FreeAT(model)
        m_repeat = 2
        for _ in range(m_repeat):
            # embedding扰动，并更新r值
            free.attack(1, "embedding.weight")  # 在embedding上添加对抗扰动
            # print('r = ', r)
            outputs = model(trains)
            loss_adv = F.cross_entropy(outputs, labels)
            loss_adv.backward()  # 反向传播，并在正常的grad基础上，累加对抗训练的梯度
    
        free.restore("embedding.weight")  # 恢复embedding参数

    class FGM():
        def __init__(self, model):
            self.model = model
            self.backup = {}
        
        def attack(self, epsilon=1., emb_name='emb.'):
            # emb_name这个参数要换成你模型中embedding的参数名
            for name, param in self.model.named_parameters():
                if param.requires_grad and emb_name in name:
                    self.backup[name] = param.data.clone()
                    norm = torch.norm(param.grad)
                    if norm != 0 and not torch.isnan(norm):
                        r_at = epsilon * param.grad / norm
                        param.data.add_(r_at)

        def restore(self, emb_name='emb.'):
            # emb_name这个参数要换成你模型中embedding的参数名
            for name, param in self.model.named_parameters():
                if param.requires_grad and emb_name in name:
                    assert name in self.backup
                    param.data = self.backup[name]
            self.backup = {}

    class PGD():
        def __init__(self, model):
            self.model = model
            self.emb_backup = {}
            self.grad_backup = {}
    
        def attack(self, epsilon=1., alpha=0.3, emb_name='emb.', is_first_attack=False):
            # emb_name这个参数要换成你模型中embedding的参数名
            for name, param in self.model.named_parameters():
                if param.requires_grad and emb_name in name:
                    if is_first_attack:
                        self.emb_backup[name] = param.data.clone()
                    norm = torch.norm(param.grad)
                    if norm != 0 and not torch.isnan(norm):
                        r_at = alpha * param.grad / norm
                        param.data.add_(r_at)
                        param.data = self.project(name, param.data, epsilon)
    
        def restore(self, emb_name='emb.'):
            # emb_name这个参数要换成你模型中embedding的参数名
            for name, param in self.model.named_parameters():
                if param.requires_grad and emb_name in name:
                    assert name in self.emb_backup
                    param.data = self.emb_backup[name]
            self.emb_backup = {}
    
        def project(self, param_name, param_data, epsilon):
            r = param_data - self.emb_backup[param_name]
            if torch.norm(r) > epsilon:
                r = epsilon * r / torch.norm(r)
            return self.emb_backup[param_name] + r
    
        def backup_grad(self):
            for name, param in self.model.named_parameters():
                if param.requires_grad:
                    # print('name: ', name)
                    self.grad_backup[name] = param.grad.clone()
    
        def restore_grad(self):
            for name, param in self.model.named_parameters():
                if param.requires_grad:
                    param.grad = self.grad_backup[name]

    class FreeAT():
        def __init__(self, model):
            self.model = model
            self.backup = {}
    
        def attack(self, r, epsilon=1., emb_name='emb.'):
            # emb_name这个参数要换成你模型中embedding的参数名
            for name, param in self.model.named_parameters():
                if param.requires_grad and emb_name in name:
                    # print('param before: ', param)
                    self.backup[name] = param.data.clone()
                    norm = torch.norm(param.grad)
                    if norm != 0 and not torch.isnan(norm):
                        r_at = epsilon * param.grad / norm
                        param.data.add_(r_at) 
            return r
    
        def restore(self, emb_name='emb.'):
            # emb_name这个参数要换成你模型中embedding的参数名
            for name, param in self.model.named_parameters():
                if param.requires_grad and emb_name in name:
                    assert name in self.backup
                    param.data = self.backup[name]
            self.backup = {}

实验过程中，其他实验参数（batch size, learning rate等）均设置相同，均训练至模型收敛，TextCNN，FGM, PGD, FreeAT效果对比如下：

模型 acc recall f1 TextCNN 0.8398 0.83984 0.83928 TextCNN + FGM 0.8461 0.8461 0.84612 TextCNN + PGD 0.8471 0.8461 0.8459 TextCNN + FreeAT 0.6057 0.5945 0.5896

加入FGM，PGD后对抗训练整体效果均好于baseline，FreeAT方法问题在于每次的r对于当前的参数都是次优的（无法最大化loss），因为当前r是由r(t-1)和theta(t-1)计算出来的，是对于theta(t-1)的最优，论文也只给出了伪代码，效果需要进一步研究。

TextCNN

TextCNN + FGM

TextCNN + PGD

TextCNN + freeAT

# 训练并测试：
这里加入不同对抗方法接口
python run.py --model TextCNN --adversarial fgm

# PGD
python run.py --model TextRNN --adversarial pgd

# freeAT
python run.py --model TextRNN --adversarial freeAT

[1] Convolutional Neural Networks for Sentence Classification.

[2] Fast is better than free: Revisiting adversarial training.

RetroSearch is an open source project built by @garambo | Open a GitHub Issue

Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo

HTML: 3.2 | Encoding: UTF-8 | Version: 0.7.4