模型考古学(二):视觉大模型发展梳理与Qwen2-VL论文解读
如果说「模型考古学」第一篇主要聚焦于大语言模型(LLM)的内部机制与演进脉络,那么本篇博客将拓宽视野,探求视觉大模型(Vision Large Language Model,VLLM)的技术原理和发展历程。在单纯的文本世界之外,视觉大模型融合了图像理解能力,赋予了AI“看”世界的眼睛,让模型理解世界的方式从一维的文字扩展到了二维的图像。
7066 字
|
35 分钟
模型考古学(一):大模型原理探赜
这篇博客探讨了大模型(如GPT系列)背后的神经网络基础,从神经网络的基本结构、反向传播算法、梯度下降法,到Transformer架构及其在大语言模型中的应用。文章详细解析了大模型的训练过程、参数优化以及如何通过海量数据提升模型性能。最后,回顾了大语言模型架构的发展历程,比较了不同模型(如BERT和GPT)的特点和应用场景。
7751 字
|
39 分钟
使用 Qwen VL 系列模型实现图片分类和OCR任务
阿里云的通义千问(Qwen)大模型在2024年末大幅降价,尤其是Qwen-VL系列模型,为开发者提供了低成本的多模态视觉-语言处理能力。通过零样本学习,开发者无需训练即可实现图片分类和OCR任务,极大提升了工作效率。本文详细介绍了如何利用Qwen-VL进行图片分类和笔记归档整理,展示了其强大的性能和易用性。
4062 字
|
20 分钟
Trading101:策略交易解析
策略交易通过数学模型、历史数据分析和计算机程序,构建系统化交易策略,力求在市场波动中获利。其优势在于纪律性、高效性和风险可控性,帮助投资者克服情绪化操作。本文介绍了现货/合约网格、马丁格尔、智能套利、定投和信号策略等工具,分析了其原理、实施方法和潜在风险,为投资者提供了策略交易的入门指南。
5365 字
|
27 分钟

国行Xbox series X/S账户转港区教程
本文详细介绍了如何将国行Xbox Series X/S主机转换为港区的完整步骤,包括U盘格式化、创建特殊文件和系统设置修改等操作,帮助玩家解锁更多游戏内容和XGP服务。
1087 字
|
5 分钟
Trading101:简析投资中常见的技术指标和其背后的逻辑
本文探讨了股票市场中基于预期差的交易机制,介绍了多种常用技术指标(如成交量、移动平均线、布林带、抛物线转向指标)的应用与局限性,帮助投资者更好地识别市场趋势与潜在交易机会。
5966 字
|
30 分钟

新一代静态博客框架Astro的部署优化指南与使用体验
本文介绍了新一代静态博客框架Astro的迁移优化步骤与使用体验,阐明了Astro的轻量化特点、灵活性及其独特的群岛架构,结合fuwari主题,提供了详细的自定义和部署指南,使开发者能够轻松构建高性能的博客。
4664 字
|
23 分钟
简析经济学与金融学实证中的几个常用简单模型
引言 经济学和金融学作为社会科学的重要分支,其研究目的在于理解和预测经济主体的行为以及金融市场的运作规律,二者研究范围很大一部分都重叠于分析复杂经济体系中各种行为主体的决策及其相互作用机制。实证研究作为连接理论与现实的桥梁,通过对数据的收集、整理和分析来检验经济理论的有效性,并为政策制定和投资决策提
7690 字
|
38 分钟