学逆向论坛

找回密码
立即注册

只需一步,快速开始

发新帖

1289

积分

0

好友

161

主题
发表于 5 天前 | 查看: 48| 回复: 0
本帖最后由 jinchanchan 于 2026-1-20 14:47 编辑

背景

今天面试字节算法岗时被问到的问题,让我用C++实现一个softmax函数。softmax是逻辑回归在多分类问题上的推广。大概的公式如下:

input:{x1​,x2​,⋯,xn​}softmax(xt​)=∑i=1n​exi​ext​​



即判断该变量在总体变量中的占比。

第一次实现

实现
我们用vector来封装输入和输出,简单的按公式复现

vector<double> softmax(vector<double> input)
{
        double total=0;
        for(auto x:input)
        {
                total+=exp(x);
        }
        vector<double> result;
        for(auto x:input)
        {
                result.push_back(exp(x)/total);
        }
        return result;
}
测试test 1
  • 测试用例1: {1, 2, 3, 4, 5}
  • 测试输出1: {0.0116562, 0.0316849, 0.0861285, 0.234122, 0.636409}
经过简单测试是正常的。


test 2但是这时面试官提出了一个问题,即如果有较大输入变量时会怎么样?

  • 测试用例2: {1, 2, 3, 4, 5, 1000}
  • 测试输出2: {0, 0, 0, 0, 0, nan}

由于e1000e^{1000}e1000已经溢出了双精度浮点(double)所能表示的范围,所以变成了NaN(not a number)。

机会
【大厂热招】前端/后端/测试等多岗位开放!地点:北京、上海、深圳等多地可选;点击 [大厂] 快速投递简历,欢迎推荐与自荐!

第二次实现(改进)

改进原理
我们注意观察softmax的公式:

input:{x1​,x2​,⋯,xn​}softmax(xt​)=∑i=1n​exi​ext​​


如果我们给上下同时乘以一个很小的数,最后答案的值是不变的。那我们可以给每一个输入xix_ixi​都减去一个值aaa,防止爆精度。大致表示如下:

∑i=1n​exi​ext​​=e−a⋅∑i=1n​exi​ext​⋅e−a​=∑i=1n​exi​⋅e−aext​⋅e−a​=∑i=1n​exi​−aext​−a​



那我们如何取这个aaa的值呢?直接取输入中最大的那个即max(xi)max(x_i)max(xi​)就好啦,这样所有的exi−ae^{x_i-a}exi​−a的值都不会超过e0=1e^0=1e0=1,更不可能爆精度了。

实现

vector<double> softmax(vector<double> input)
{
        double total=0;
        double MAX=input[0];
        for(auto x:input)
        {
                MAX=max(x,MAX);
        }
        for(auto x:input)
        {
                total+=exp(x-MAX);
        }
        vector<double> result;
        for(auto x:input)
        {
                result.push_back(exp(x-MAX)/total);
        }
        return result;
}


测试test 1
  • 测试用例1: {1, 2, 3, 4, 5, 1000}
  • 测试输出1: {0, 0, 0, 0, 0, 1}

test 2
  • 测试用例1: {0, 19260817, 19260817}
  • 测试输出1: {0, 0.5, 0.5}




完整代码
#include <iostream>
#include <vector>
#include <math.h>
using namespace std;

vector<double> softmax(vector<double> input)
{
        double total=0;
        double MAX=input[0];
        for(auto x:input)
        {
                MAX=max(x,MAX);
        }
        for(auto x:input)
        {
                total+=exp(x-MAX);
        }
        vector<double> result;
        for(auto x:input)
        {
                result.push_back(exp(x-MAX)/total);
        }
        return result;
}

int main(int argc, char *argv[])
{
        int n;
        cin>>n;
        vector<double> input;
        while(n--)
        {
                double x;
                cin>>x;
                input.push_back(x);
        }
        for(auto y:softmax(input))
        {
                cout<<y<<' ';
        }
}


转载:

作者:Concyclics;来源:稀土掘金







温馨提示:
1.如果您喜欢这篇帖子,请给作者点赞评分,点赞会增加帖子的热度,评分会给作者加学币。(评分不会扣掉您的积分,系统每天都会重置您的评分额度)。
2.回复帖子不仅是对作者的认可,还可以获得学币奖励,请尊重他人的劳动成果,拒绝做伸手党!
3.发广告、灌水回复等违规行为一经发现直接禁言,如果本帖内容涉嫌违规,请点击论坛底部的举报反馈按钮,也可以在【投诉建议】板块发帖举报。

小黑屋|手机版|站务邮箱|学逆向论坛 ( 粤ICP备2021023307号 )|网站地图

GMT+8, 2026-1-25 12:57 , Processed in 0.103625 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表