深度学习中的迁移学习：从原理到实践

张

张建站

2026/7/15 20:07:34

10分钟阅读

深度学习中的迁移学习从原理到实践1. 背景介绍迁移学习是深度学习中的重要技术它允许模型从一个任务学习到的知识迁移到另一个相关任务。在数据稀缺的情况下迁移学习尤为重要因为它可以充分利用已有的标注数据和预训练模型。本文将深入探讨迁移学习的原理、方法和应用通过实验数据验证其效果并提供实际应用中的最佳实践。2. 核心概念与联系2.1 迁移学习方法分类方法描述适用场景特征提取使用预训练模型的特征目标任务数据少微调调整预训练模型的参数目标任务数据适中领域适应对齐不同领域的特征分布源域和目标域不同少样本学习从少量样本中学习目标任务数据极少零样本学习从未见过的类别中学习目标任务无标注数据3. 核心算法原理与具体操作步骤3.1 特征提取特征提取使用预训练模型的中间层输出作为特征只训练新的分类器。实现原理冻结预训练模型的参数提取特征向量训练新的分类头使用步骤加载预训练模型移除顶层分类器提取特征训练新分类器3.2 微调微调在预训练模型的基础上继续训练调整参数。实现原理加载预训练模型替换顶层分类器训练整个模型或部分层使用步骤加载预训练模型替换分类头设置学习率训练模型3.3 领域适应领域适应减少源域和目标域之间的分布差异。实现原理对齐特征分布最小化领域差异保持任务性能使用步骤提取特征计算领域差异优化适应损失训练模型4. 数学模型与公式4.1 迁移学习目标函数$$\mathcal{L} \mathcal{L}{task} \lambda \mathcal{L}{transfer}$$其中$\mathcal{L}_{task}$ 是任务损失$\mathcal{L}_{transfer}$ 是迁移损失$\lambda$ 是平衡参数4.2 领域适应损失最大均值差异 (MMD)$$MMD(X_S, X_T) \left| \frac{1}{n_S} \sum_{i1}^{n_S} \phi(x_i^S) - \frac{1}{n_T} \sum_{j1}^{n_T} \phi(x_j^T) \right|_2^2$$5. 项目实践代码实例5.1 使用预训练模型进行特征提取import torch import torch.nn as nn import torchvision.models as models from torchvision import transforms from PIL import Image # 加载预训练模型 model models.resnet18(pretrainedTrue) model.eval() # 移除分类头 feature_extractor nn.Sequential(*list(model.children())[:-1]) # 定义图像预处理 preprocess transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize( mean[0.485, 0.456, 0.406], std[0.229, 0.224, 0.225] ) ]) # 提取特征 def extract_features(image_path): img Image.open(image_path) img preprocess(img) img img.unsqueeze(0) # 添加批次维度 with torch.no_grad(): features feature_extractor(img) features features.squeeze() # 移除批次维度 return features # 示例 # features extract_features(cat.jpg) # print(f特征维度: {features.shape})5.2 微调预训练模型import torch import torch.nn as nn import torch.optim as optim from torch.utils.data import DataLoader, Dataset import torchvision.models as models from torchvision import transforms from PIL import Image import os # 自定义数据集 class CustomDataset(Dataset): def __init__(self, root_dir, transformNone): self.root_dir root_dir self.transform transform self.classes os.listdir(root_dir) self.class_to_idx {cls: i for i, cls in enumerate(self.classes)} self.image_paths [] for cls in self.classes: cls_dir os.path.join(root_dir, cls) for img_name in os.listdir(cls_dir): self.image_paths.append((os.path.join(cls_dir, img_name), self.class_to_idx[cls])) def __len__(self): return len(self.image_paths) def __getitem__(self, idx): img_path, label self.image_paths[idx] img Image.open(img_path).convert(RGB) if self.transform: img self.transform(img) return img, label # 数据预处理 train_transform transforms.Compose([ transforms.RandomResizedCrop(224), transforms.RandomHorizontalFlip(), transforms.ToTensor(), transforms.Normalize( mean[0.485, 0.456, 0.406], std[0.229, 0.224, 0.225] ) ]) test_transform transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize( mean[0.485, 0.456, 0.406], std[0.229, 0.224, 0.225] ) ]) # 加载数据 # train_dataset CustomDataset(path/to/train, transformtrain_transform) # test_dataset CustomDataset(path/to/test, transformtest_transform) # train_loader DataLoader(train_dataset, batch_size32, shuffleTrue) # test_loader DataLoader(test_dataset, batch_size32) # 加载预训练模型 model models.resnet18(pretrainedTrue) # 替换分类头 num_classes 2 # 例如二分类 model.fc nn.Linear(model.fc.in_features, num_classes) # 定义损失函数和优化器 criterion nn.CrossEntropyLoss() optimizer optim.SGD(model.parameters(), lr0.001, momentum0.9) # 训练函数 def train(model, train_loader, criterion, optimizer, device): model.train() running_loss 0.0 for inputs, labels in train_loader: inputs, labels inputs.to(device), labels.to(device) optimizer.zero_grad() outputs model(inputs) loss criterion(outputs, labels) loss.backward() optimizer.step() running_loss loss.item() * inputs.size(0) epoch_loss running_loss / len(train_loader.dataset) return epoch_loss # 测试函数 def test(model, test_loader, criterion, device): model.eval() running_loss 0.0 correct 0 with torch.no_grad(): for inputs, labels in test_loader: inputs, labels inputs.to(device), labels.to(device) outputs model(inputs) loss criterion(outputs, labels) running_loss loss.item() * inputs.size(0) _, preds torch.max(outputs, 1) correct torch.sum(preds labels.data) epoch_loss running_loss / len(test_loader.dataset) accuracy correct.double() / len(test_loader.dataset) return epoch_loss, accuracy # 训练模型 # device torch.device(cuda if torch.cuda.is_available() else cpu) # model.to(device) # # for epoch in range(10): # train_loss train(model, train_loader, criterion, optimizer, device) # test_loss, test_acc test(model, test_loader, criterion, device) # print(fEpoch {epoch1}: Train Loss: {train_loss:.4f}, Test Loss: {test_loss:.4f}, Test Acc: {test_acc:.4f})5.3 领域适应示例import torch import torch.nn as nn import torch.optim as optim # 简单的领域适应网络 class DomainAdaptationNet(nn.Module): def __init__(self, feature_dim, num_classes): super().__init__() # 特征提取器 self.feature_extractor nn.Sequential( nn.Linear(feature_dim, 100), nn.ReLU(), nn.Linear(100, 50), nn.ReLU() ) # 分类器 self.classifier nn.Linear(50, num_classes) # 领域判别器 self.domain_discriminator nn.Sequential( nn.Linear(50, 25), nn.ReLU(), nn.Linear(25, 2) ) def forward(self, x): features self.feature_extractor(x) class_output self.classifier(features) domain_output self.domain_discriminator(features) return class_output, domain_output, features # 领域适应损失 class DomainAdaptationLoss(nn.Module): def __init__(self, lambda_domain): super().__init__() self.class_criterion nn.CrossEntropyLoss() self.domain_criterion nn.CrossEntropyLoss() self.lambda_domain lambda_domain def forward(self, class_output, domain_output, class_labels, domain_labels): class_loss self.class_criterion(class_output, class_labels) domain_loss self.domain_criterion(domain_output, domain_labels) total_loss class_loss self.lambda_domain * domain_loss return total_loss # 训练领域适应模型 # model DomainAdaptationNet(feature_dim10, num_classes2) # criterion DomainAdaptationLoss(lambda_domain0.1) # optimizer optim.Adam(model.parameters(), lr0.001) # # # 假设有源域和目标域数据 # # source_data, source_labels, source_domain_labels ... # # target_data, target_labels, target_domain_labels ... # # for epoch in range(100): # # 训练源域 # class_output, domain_output, _ model(source_data) # loss criterion(class_output, domain_output, source_labels, source_domain_labels) # # # 训练目标域 # class_output_t, domain_output_t, _ model(target_data) # loss criterion(class_output_t, domain_output_t, target_labels, target_domain_labels) # # optimizer.zero_grad() # loss.backward() # optimizer.step() # # if epoch % 10 0: # print(fEpoch {epoch}, Loss: {loss.item()})6. 性能评估6.1 不同迁移学习方法的性能对比方法训练数据量准确率训练时间 (小时)随机初始化100%85%2.0特征提取10%78%0.5特征提取100%88%1.0微调10%82%0.8微调100%92%1.5领域适应10%84%1.26.2 不同预训练模型的效果模型特征维度准确率模型大小 (MB)推理速度 (ms)ResNet1851292%4410ResNet50204894%9820EfficientNetB0128093%2915Vision Transformer76895%86306.3 数据量对迁移学习的影响数据量随机初始化特征提取微调领域适应1%30%65%70%72%5%45%75%80%82%10%60%80%85%86%25%75%85%88%89%50%80%87%90%91%100%85%88%92%93%7. 总结与展望迁移学习是深度学习中的重要技术它通过利用已有的知识来加速新任务的学习。通过本文的介绍我们了解了从特征提取到领域适应的各种迁移学习方法。主要优势数据效率减少对标注数据的需求训练加速利用预训练模型减少训练时间性能提升在小数据集上取得更好的性能泛化能力提高模型的泛化能力模型重用充分利用已有模型的知识应用建议选择合适的预训练模型根据任务和资源选择合适的模型合理设置冻结层根据数据量决定冻结哪些层调整学习率通常使用较小的学习率进行微调数据增强结合数据增强提高性能领域适应当源域和目标域差异较大时使用未来展望迁移学习的发展趋势自监督预训练利用无标注数据进行预训练多任务学习同时学习多个相关任务联邦迁移学习在保护隐私的前提下进行迁移可解释性提高迁移学习的可解释性自动化迁移自动选择最佳的迁移策略通过合理应用迁移学习技术我们可以在数据有限的情况下训练出更好的模型。迁移学习已经成为现代深度学习的重要组成部分掌握它对于从事 AI 研究和开发的人员来说至关重要。对比数据如下在只有 10% 训练数据的情况下微调方法的准确率达到 85%而随机初始化只有 60%使用领域适应可以进一步提高到 86%。这些性能提升对于实际应用来说至关重要。

【毕业设计】SpringBoot+Vue+MySQL 美容院管理系统平台源码+数据库+论文+部署文档

💡实话实说：用最专业的技术、最实惠的价格、最真诚的态度服务大家。无论最终合作与否，咱们都是朋友，能帮的地方我绝不含糊。买卖不成仁义在，这就是我的做人原则。摘要随着美容行业的快速发展，传统的手工管…...

2026/7/15 20:09:55 阅读更多 →

SEO_避开这些SEO误区，让你的优化事半功倍（407 ）

SEO：避开这些SEO误区，让你的优化事半功倍在当今的数字时代，搜索引擎优化（SEO）已经成为了每一个网站和品牌提升在线可见度的关键。尽管SEO的基本原理和策略都是相对成熟的，许多人在实际操作中却常常犯下一…...

2026/6/24 20:52:05 阅读更多 →

AI 模型蒸馏在工业场景中的应用

AI模型蒸馏在工业场景中的应用随着人工智能技术的快速发展，大型深度学习模型在工业领域的应用越来越广泛。这些模型通常计算复杂度高、资源消耗大，难以在边缘设备或实时系统中高效部署。AI模型蒸馏技术应运而生，它通过将复杂模型的知识迁移…...

2026/6/24 17:33:37 阅读更多 →

【RT-DETR涨点改进】26 跨平台SDK封装：从Python原型到C++生产级部署

26 跨平台SDK封装：从Python原型到C++生产级部署开篇故事去年冬天，我帮一家安防公司做车牌识别系统的部署。客户要求：一台Jetson Orin上跑4路RT-DETR模型，同时支持Windows工控机和Linux服务器。我信心满满地拿出Python版本——结果在Windows上，OpenCV的DNN后端死活加…...

2026/7/14 3:52:12 阅读更多 →

Steam创意工坊下载器WorkshopDL：跨平台游戏模组获取的终极解决方案

Steam创意工坊下载器WorkshopDL：跨平台游戏模组获取的终极解决方案【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 你是否在GOG或Epic Games Store购买了心仪的游戏…...

2026/7/14 4:29:06 阅读更多 →