# 定义

标准形式的优化问题如下:

minxf0(x)s.t.fi(x)0,i=1,,mhj(x)=0,j=1,,p\begin{align*} \min_{x} \quad & f_0(x) \\ \text{s.t.} \quad & f_i(x) \leq 0,\quad i=1,\dots, m \\ & h_j(x) = 0,\quad j=1,\dots, p \end{align*}

  • xRnx \in \mathbb{R}^n 是优化变量
  • f0:RnRf_0: \mathbb{R}^n \to \mathbb{R} 为目标函数(cost/objective function)
  • fi:RnR, i=1,,mf_i: \mathbb{R}^n \to \mathbb{R},\ i=1,\dots, m 是不等式约束函数
  • hj:RnR, j=1,,ph_j: \mathbb{R}^n \to \mathbb{R},\ j=1,\dots, p 是等式约束函数

最优值定义:

p=inf{f0(x)fi(x)0, i=1,,m; hj(x)=0, j=1,,p}p^* = \inf \left\{ f_0(x)\mid f_i(x) \leq 0,\ i=1,\dots, m;\ h_j(x) = 0,\ j=1,\dots, p \right\}

  • 如果无可行解(即不存在任何 xx 满足所有约束),则 p=+p^* = +\infty
  • 如果问题无界下,即 f0(x)f_0(x) 可以趋于 -\infty,则 p=p^* = -\infty

相关定义:

  • xdom f0x \in \text{dom}\ f_0 且满足所有约束,则称 xx 为可行解(feasible)
  • xx 可行且 f0(x)=pf_0(x) = p^*,则 xx 为最优解,所有最优解组成集合 XoptX^*_\text{opt}
  • 若满足存在 R>0R>0,在 zx2R|z-x|_2 \leq Rxx 对应的局部子问题最优,则 xx 为局部最优

举例n=1n=1, m=p=0m=p=0):

  • f0(x)=1/x, dom f0=R++f_0(x) = 1/x,\ \mathrm{dom}\ f_0 = \mathbb{R}_{++}p=0p^* = 0,但不存在最优点
  • f0(x)=logx, dom f0=R++f_0(x) = -\log x,\ \mathrm{dom}\ f_0 = \mathbb{R}_{++}p=p^* = -\infty
  • f0(x)=xlogx, dom f0=R++f_0(x) = x\log x,\ \mathrm{dom}\ f_0 = \mathbb{R}_{++}p=1/e, x=1/ep^* = -1/e,\ x=1/e 达到最优
  • f0(x)=x33xf_0(x) = x^3 - 3xp=p^* = -\infty,但 x=1x=1 处有局部最小

优化问题的标准形式隐含一个域约束 xD=i=0mdom fij=1pdom hjx \in D= \bigcap_{i=0}^m \mathrm{dom}\ f_i \cap \bigcap_{j=1}^p \mathrm{dom}\ h_j,其中 DD 称为问题的fi(x)0,hj(x)=0f_i(x) \leq 0, h_j(x)=0显式约束。若 m=p=0m=p=0,即为无约束问题。

例子:

minx ilog(biaiTx)\min_x \ -\sum_i \log(b_i - a_i^T x)

这是无显式约束问题,但隐含约束 aiTx<bia_i^T x < b_i

凸规划/凸优化问题定义

当满足:

  • 目标函数 f0f_0凸函数
  • 所有不等式约束 fif_i 均为凸函数
  • 所有等式约束 hjh_j仿射函数(即 hj(x)=ajTx+bjh_j(x) = a_j^T x + b_j,线性函数)

时,标准形式问题称为凸优化问题

根据凸集性质或凸集定义易证:凸优化问题的可行域一定为凸集。

# 非凸问题与等价(转化)问题

某些非凸优化问题可通过变量变换、等式消除或引入 slack 变量等方式转化为凸问题。常见保持凸性的等价变换有:

  • 消除等式约束

    minx f0(x)s.t. fi(x)0, Ax=b\min_x\ f_0(x)\quad \text{s.t.}\ f_i(x)\leq 0,\ Ax=b

    等价于

    minz f0(Fz+x0)s.t. fi(Fz+x0)0\min_z\ f_0(Fz + x_0)\quad \text{s.t.}\ f_i(Fz+x_0)\leq 0

    其中 x=Fz+x0x=Fz + x_0 表示满足 Ax=bAx=b 的所有 xx

  • 引入 slack 变量

    aiTxbi  aiTx+si=bi, si0a_i^T x \leq b_i\ \Leftrightarrow\ a_i^T x + s_i = b_i,\ s_i\geq 0

  • 上凸包/epigraph 形式

    minx,t ts.t. f0(x)t0\min_{x,t} \ t\quad \text{s.t.}\ f_0(x) - t \leq 0

  • 变量消元(最小化部分变量)

    minx1,x2f0(x1,x2), s.t. fi(x1)0\min_{x_1, x_2} f_0(x_1, x_2),\ \text{s.t.}\ f_i(x_1)\leq 0

    等价于

    f0(x1):=infx2f0(x1,x2)f_0(x_1) := \inf_{x_2} f_0(x_1, x_2)

# 準凸(Quasiconvex)优化

如果 f0f_0 是準凸函数(quasiconvex),约束 fif_i 凸,等式约束仿射,问题一般不是凸优化,但可用一些手段处理(例如二分法/bisection——通过求解一系列凸可行性问题 φt(x)0,fi(x)0,Ax=b\varphi_t(x)\leq 0, f_i(x)\leq 0, Ax=b 来近似 pp^*)。

举例:

  • 分式目标 f0(x)=p(x)q(x)f_0(x) = \frac{p(x)}{q(x)}pp 凸、qq 凸且 q>0q > 0,可用 φt(x)=p(x)tq(x)\varphi_t(x) = p(x) - t q(x) 替换,φt\varphi_t 关于 xx 是凸函数。

# 例子

  1. 线性规划 (Linear Programming, LP)

    minxcTxs.t.GxhAx=b\begin{align*} \min_x \quad & c^T x \\ \text{s.t.} \quad & Gx \preceq h \\ & Ax = b \end{align*}

    • 目标函数和约束函数都是仿射函数(线性函数)
    • 可行域是多面体(polyhedron)
  2. 线性分式规划 (Linear-Fractional Program)

    minxf0(x)=aTx+deTx+fs.t.GxhAx=b\begin{align*} \min_x \quad & f_0(x) = \frac{a^T x + d}{e^T x + f} \\ \text{s.t.} \quad & Gx \preceq h \\ & Ax = b \end{align*}

    • 目标函数是线性分式函数,定义域为 dom f0={xeTx+f>0}\text{dom}\ f_0 = \{x \mid e^T x + f > 0\}
    • 这是一个拟凸优化问题(quasiconvex optimization problem),不是凸优化问题
    • 可以通过二分法(bisection)求解:通过求解一系列凸可行性问题来近似最优值
    • 可以等价转化为线性规划:引入变量 y=x/(eTx+f)y = x/(e^T x + f)z=1/(eTx+f)z = 1/(e^T x + f),则原问题等价于

      miny,zcTy+dzs.t.GyhzAy=bzeTy+fz=1z0\begin{align*} \min_{y,z} \quad & c^T y + d z \\ \text{s.t.} \quad & Gy \preceq h z \\ & Ay = b z \\ & e^T y + f z = 1 \\ & z \geq 0 \end{align*}

    • 其中 c=ac = a,转化后的问题是线性规划
  3. 广义线性分式规划 (Generalized Linear-Fractional Program)

    • 目标函数为多个线性分式函数的最大值或加权和
    • 形式更一般,但仍可通过类似方法转化为线性规划或使用二分法求解
  4. 二次规划 (Quadratic Programming, QP)

    minx(1/2)xTPx+qTx+rs.t.GxhAx=b\begin{align*} \min_x \quad & (1/2)x^T P x + q^T x + r \\ \text{s.t.} \quad & Gx \preceq h \\ & Ax = b \end{align*}

    • 目标函数是二次函数,其中 P0P \succeq 0(半正定矩阵)
    • 约束函数是仿射函数
    • P0P \succ 0 时,目标函数是严格凸函数,有唯一最优解
  5. 二次约束二次规划 (Quadratically Constrained Quadratic Programming, QCQP)

    minx(1/2)xTP0x+q0Tx+r0s.t.(1/2)xTPix+qiTx+ri0,i=1,,mAx=b\begin{align*} \min_x \quad & (1/2)x^T P_0 x + q_0^T x + r_0 \\ \text{s.t.} \quad & (1/2)x^T P_i x + q_i^T x + r_i \leq 0,\quad i=1,\dots, m \\ & Ax = b \end{align*}

    • 目标函数和约束函数都是二次函数
    • 要求 Pi0, i=0,1,,mP_i \succeq 0,\ i=0,1,\dots, m(所有二次项系数矩阵半正定)
  6. 半正定规划 (Semidefinite Programming, SDP)

    minxcTxs.t.x1F1+x2F2++xnFn+G0Ax=b\begin{align*} \min_x \quad & c^T x \\ \text{s.t.} \quad & x_1 F_1 + x_2 F_2 + \cdots + x_n F_n + G \preceq 0 \\ & Ax = b \end{align*}

    • 约束包含线性矩阵不等式 (LMI)
    • 其中 Fi,GSkF_i, G \in S^kk×kk \times k 对称矩阵)
    • 这是线性规划的推广,将向量不等式推广到矩阵不等式
  7. 锥规划 (Cone Programming)

    minxcTxs.t.Fx+gK0Ax=b\begin{align*} \min_x \quad & c^T x \\ \text{s.t.} \quad & Fx + g \preceq_{\mathcal{K}} 0 \\ & Ax = b \end{align*}

    • 使用广义不等式 K\preceq_{\mathcal{K}},其中 K\mathcal{K} 是正常锥(proper cone)
    • K=R+n\mathcal{K} = \mathbb{R}_+^n 时,退化为线性规划
    • K=S+n\mathcal{K} = S_+^n 时,为半正定规划
    • K\mathcal{K} 为洛伦兹锥时,为二阶锥规划 (SOCP)
  8. 几何规划 (Geometric Programming, GP)

    • 通过变量替换可以转化为凸优化问题
    • 原始形式不是凸的,但可以通过对数变换转化为凸问题
  9. 最小二乘问题 (Least Squares)

    minxAxb22\min_x \quad \|Ax - b\|_2^2

    • 无约束二次优化问题
    • AA 列满秩时,有解析解 x=(ATA)1ATbx^* = (A^T A)^{-1} A^T b
  10. 带约束的最小二乘

minxAxb22s.t.Cx=dx2R \begin{align*} \min_x \quad & \|Ax - b\|_2^2 \\ \text{s.t.} \quad & Cx = d \\ & \|x\|_2 \leq R \end{align*}

  • 约束可以是等式约束或范数约束

# 平方和

平方和(Sum of Squares, SOS)优化是凸优化中的一个重要主题,与正多项式和半正定规划密切相关。

  1. Hilbert's 17th Problem

    • 问题:一个在 Rn\mathbb{R}^n 上非负的多项式是否总能表示为有理函数的平方和?
    • 答案:对于多项式,不一定能表示为多项式的平方和,但可以表示为有理函数的平方和
    • 对于矩阵情况,有类似的结论
  2. 平方和多项式 (Sum of Squares Polynomials)

    • 一个多项式 p(x)p(x) 是平方和多项式,如果存在多项式 qi(x)q_i(x) 使得

      p(x)=i=1kqi2(x)p(x) = \sum_{i=1}^k q_i^2(x)

    • 平方和多项式一定是非负的(p(x)0p(x) \geq 0 对所有 xx
    • 但非负多项式不一定是平方和多项式(反例由 Motzkin 给出)
  3. 平方和与半正定规划的关系

    • 判断一个多项式是否为平方和可以转化为半正定规划问题
    • 给定多项式 p(x)p(x),寻找 Gram 矩阵 Q0Q \succeq 0 使得 p(x)=z(x)TQz(x)p(x) = z(x)^T Q z(x)
    • 其中 z(x)z(x) 是包含 xx 的单项式向量(monomial vector)
    • 这可以表述为线性矩阵不等式(LMI)约束
  4. 平方和优化 (SOS Optimization)

    • 优化问题:在平方和约束下优化目标函数
    • 形式:

      mincTxs.t.pi(x) 是平方和多项式,i=1,,m\begin{align*} \min \quad & c^T x \\ \text{s.t.} \quad & p_i(x) \text{ 是平方和多项式},\quad i=1,\dots, m \end{align*}

    • 这类问题可以转化为半正定规划问题求解

# 多目标优化

多目标优化(Multicriterion Optimization)问题同时考虑多个目标函数,需要在多个目标之间进行权衡。

  1. 多目标优化问题形式

    minx(f1(x),f2(x),,fk(x))s.t.fi(x)0,i=1,,mhj(x)=0,j=1,,p\begin{align*} \min_x \quad & (f_1(x), f_2(x), \ldots, f_k(x)) \\ \text{s.t.} \quad & f_i(x) \leq 0,\quad i=1,\dots, m \\ & h_j(x) = 0,\quad j=1,\dots, p \end{align*}

    • kk 个目标函数 f1,f2,,fk:RnRf_1, f_2, \ldots, f_k: \mathbb{R}^n \to \mathbb{R}
    • 目标函数值构成向量 (f1(x),f2(x),,fk(x))Rk(f_1(x), f_2(x), \ldots, f_k(x)) \in \mathbb{R}^k
    • 通常不存在一个解能同时最小化所有目标函数
  2. Pareto 最优解 (Pareto Optimal Solution)

    • 定义:可行解 xx^* 是 Pareto 最优的,如果不存在另一个可行解 xx 使得
      • fi(x)fi(x)f_i(x) \leq f_i(x^*) 对所有 i=1,,ki=1,\ldots, k 成立
      • 且至少存在一个 jj 使得 fj(x)<fj(x)f_j(x) < f_j(x^*)
    • 也称为非支配解(non-dominated solution)或有效解(efficient solution)
    • Pareto 最优解集:所有 Pareto 最优解组成的集合,称为 Pareto 前沿(Pareto frontier)
  3. 标量化方法 (Scalarization)
    将多目标优化问题转化为单目标优化问题:

    加权和方法 (Weighted Sum Method)

    minxi=1kwifi(x)\min_x \quad \sum_{i=1}^k w_i f_i(x)

    • 其中 wi0,i=1,,kw_i \geq 0, i=1,\ldots, ki=1kwi=1\sum_{i=1}^k w_i = 1(或 i=1kwi>0\sum_{i=1}^k w_i > 0
    • 当所有 fif_i 是凸函数时,加权和也是凸函数
    • 通过改变权重 wiw_i 可以得到不同的 Pareto 最优解
    • 注意:并非所有 Pareto 最优解都能通过加权和方法得到(特别是非凸情况)

    ϵ\epsilon-约束方法 (ϵ\epsilon-Constraint Method)

    minxfj(x)s.t.fi(x)ϵi,i=1,,k, ij其他约束\begin{align*} \min_x \quad & f_j(x) \\ \text{s.t.} \quad & f_i(x) \leq \epsilon_i,\quad i=1,\ldots, k,\ i \neq j \\ & \text{其他约束} \end{align*}

    • 选择一个目标函数作为主目标,其他目标函数作为约束
    • 通过调整 ϵi\epsilon_i 可以得到不同的 Pareto 最优解
  4. 凸多目标优化

    • 当所有目标函数 fif_i 都是凸函数,且约束函数也是凸函数时,称为凸多目标优化问题
    • 对于凸多目标优化,加权和方法可以找到所有 Pareto 最优解
    • Pareto 前沿在目标空间中通常是凸的

# 可微无约束优化问题的最优性条件

对于可微的无约束优化问题,最优性条件基于目标函数的梯度。

  1. 无约束优化问题的最优性条件

    考虑无约束优化问题:

    minxf0(x)\min_x \quad f_0(x)

    一阶必要条件(First-Order Necessary Condition)

    • xx^* 是局部最优解,且 f0f_0xx^* 处可微,则

      f0(x)=0\nabla f_0(x^*) = 0

    • 满足 f0(x)=0\nabla f_0(x) = 0 的点称为驻点(stationary point)或临界点(critical point)
    • 驻点包括:局部最小值、局部最大值、鞍点

    二阶条件(Second-Order Conditions)

    • 二阶必要条件:若 xx^* 是局部最优解,且 f0f_0xx^* 处二次可微,则

      f0(x)=0,2f0(x)0\nabla f_0(x^*) = 0, \quad \nabla^2 f_0(x^*) \succeq 0

    • 二阶充分条件:若 f0f_0xx^* 处二次可微,且

      f0(x)=0,2f0(x)0\nabla f_0(x^*) = 0, \quad \nabla^2 f_0(x^*) \succ 0

      xx^* 是严格局部最小值

    凸函数情况

    • 对于凸函数 f0f_0,一阶条件 f0(x)=0\nabla f_0(x^*) = 0充要条件
    • 即:xx^* 是全局最优解     \iff f0(x)=0\nabla f_0(x^*) = 0xdom f0x^* \in \text{dom}\ f_0
    • 这是因为凸函数的任意局部最小值都是全局最小值
  2. 等式约束优化问题的最优性条件

    考虑等式约束优化问题:

    minxf0(x)s.t.Ax=b\begin{align*} \min_x \quad & f_0(x) \\ \text{s.t.} \quad & Ax = b \end{align*}

    最优性条件

    • xx^* 是最优解当且仅当存在拉格朗日乘子向量 νRp\nu \in \mathbb{R}^p 使得

      xdom f0,Ax=b,f0(x)+ATν=0x^* \in \text{dom}\ f_0, \quad Ax^* = b, \quad \nabla f_0(x^*) + A^T \nu = 0

    • 这等价于:f0(x)\nabla f_0(x^*) 属于 AA 的行空间(或 ATA^T 的列空间)
    • 对于凸函数,这也是充要条件
  3. 非负象限上的优化问题

    考虑非负约束优化问题:

    minxf0(x)s.t.x0\begin{align*} \min_x \quad & f_0(x) \\ \text{s.t.} \quad & x \succeq 0 \end{align*}

    最优性条件

    • xx^* 是最优解当且仅当

      xdom f0,x0,{f0(x)i0xi=0f0(x)i=0xi>0x^* \in \text{dom}\ f_0, \quad x^* \succeq 0, \quad \begin{cases} \nabla f_0(x^*)_i \geq 0 & x_i^* = 0 \\ \nabla f_0(x^*)_i = 0 & x_i^* > 0 \end{cases}

    • 这称为互补松弛条件(complementary slackness condition)
    • 对于凸函数,这也是充要条件
  4. 应用示例

    • 无约束问题:minxAxb22\min_x \|Ax - b\|_2^2 的最优解满足 ATAx=ATbA^T A x = A^T b
    • 等式约束:minx cTx\min_x \ c^T x s.t. Ax=bAx = b 的最优解满足 c+ATν=0c + A^T \nu = 0 对某个 ν\nu
    • 非负约束:minx cTx\min_x \ c^T x s.t. x0x \succeq 0 的最优解满足 c0c \succeq 0cixi=0c_i x_i = 0 对所有 ii

# 可微有约束优化问题的最优性条件

对于可微的有约束优化问题,最优性条件基于拉格朗日乘子理论和KKT条件。

  1. 标准形式的约束优化问题

    minxf0(x)s.t.fi(x)0,i=1,,mhj(x)=0,j=1,,p\begin{align*} \min_x \quad & f_0(x) \\ \text{s.t.} \quad & f_i(x) \leq 0,\quad i=1,\dots, m \\ & h_j(x) = 0,\quad j=1,\dots, p \end{align*}

    其中 f0,fi,hj:RnRf_0, f_i, h_j: \mathbb{R}^n \to \mathbb{R} 都是可微函数。

  2. 拉格朗日函数 (Lagrangian Function)

    L(x,λ,μ)=f0(x)+i=1mλifi(x)+j=1pμjhj(x)L(x, \lambda, \mu) = f_0(x) + \sum_{i=1}^m \lambda_i f_i(x) + \sum_{j=1}^p \mu_j h_j(x)

    • λ=[λ1,,λm]TRm\lambda = [\lambda_1, \ldots, \lambda_m]^T \in \mathbb{R}^m 是不等式约束的拉格朗日乘子
    • μ=[μ1,,μp]TRp\mu = [\mu_1, \ldots, \mu_p]^T \in \mathbb{R}^p 是等式约束的拉格朗日乘子
  3. KKT 条件 (Karush-Kuhn-Tucker Conditions)

    xx^* 是局部最优解,且在 xx^* 处满足某些约束品性(constraint qualification),则存在拉格朗日乘子 λRm\lambda^* \in \mathbb{R}^mμRp\mu^* \in \mathbb{R}^p 使得以下KKT条件成立:

    稳定性条件(Stationarity Condition)

    xL(x,λ,μ)=f0(x)+i=1mλifi(x)+j=1pμjhj(x)=0\nabla_x L(x^*, \lambda^*, \mu^*) = \nabla f_0(x^*) + \sum_{i=1}^m \lambda_i^* \nabla f_i(x^*) + \sum_{j=1}^p \mu_j^* \nabla h_j(x^*) = 0

    原问题可行性条件(Primal Feasibility)

    fi(x)0,i=1,,m;hj(x)=0,j=1,,pf_i(x^*) \leq 0,\quad i=1,\ldots, m; \quad h_j(x^*) = 0,\quad j=1,\ldots, p

    对偶可行性条件(Dual Feasibility)

    λi0,i=1,,m\lambda_i^* \geq 0,\quad i=1,\ldots, m

    互补松弛条件(Complementary Slackness)

    λifi(x)=0,i=1,,m\lambda_i^* f_i(x^*) = 0,\quad i=1,\ldots, m

    满足KKT条件的点 xx^* 称为KKT点KKT解,是局部最优解(充分条件)。

  4. 约束品性 (Constraint Qualification)

    约束品性用于保证局部最优解满足KKT条件。常见的约束品性包括:

    线性无关约束品性 (LICQ - Linear Independence Constraint Qualification)

    • 在可行点 xx^* 处,所有起作用的约束(active constraints)的梯度线性无关
    • 起作用的不等式约束:I(x)={ifi(x)=0}I(x^*) = \{i \mid f_i(x^*) = 0\}
    • LICQ要求:{fi(x),iI(x);hj(x),j=1,,p}\{\nabla f_i(x^*), i \in I(x^*); \nabla h_j(x^*), j=1,\ldots, p\} 线性无关

    其他约束品性

    • Mangasarian-Fromovitz约束品性(MFCQ)
    • Slater约束品性(适用于凸优化问题)

    注意:即使不满足约束品性,最优解仍可能满足KKT条件;但若不满足约束品性,最优解不一定满足KKT条件。

  5. Fritz John 条件 (Fritz John Conditions)

    若在局部最优解 xx^* 处有 LO(x)=TO(x)L_O(x^*) = T_O(x^*)(线性化可行方向锥等于切锥),则存在 λ00,λR+m,μRp\lambda_0 \geq 0, \lambda \in \mathbb{R}_+^m, \mu \in \mathbb{R}^p,使得:

    稳定性条件

    λ0f0(x)+i=1mλifi(x)+j=1pμjhj(x)=0\lambda_0 \nabla f_0(x^*) + \sum_{i=1}^m \lambda_i \nabla f_i(x^*) + \sum_{j=1}^p \mu_j \nabla h_j(x^*) = 0

    原问题可行性条件

    fi(x)0, i=1,,m;hj(x)=0, j=1,,pf_i(x^*) \leq 0,\ i=1,\ldots, m; \quad h_j(x^*) = 0,\ j=1,\ldots, p

    对偶可行性条件

    λi0,i=1,,m\lambda_i \geq 0,\quad i=1,\ldots, m

    互补松弛条件

    λifi(x)=0,i=1,,m\lambda_i f_i(x^*) = 0,\quad i=1,\ldots, m

    满足上述条件的点称为Fritz John点Fritz John解

    与KKT条件的关系

    • λ0>0\lambda_0 > 0 时,Fritz John条件等价于KKT条件(可归一化使 λ0=1\lambda_0 = 1
    • λ0=0\lambda_0 = 0 时,称为异常情况(abnormal case),此时目标函数梯度不参与条件
  6. 凸优化问题的KKT条件

    对于凸优化问题(f0,fif_0, f_i 凸,hjh_j 仿射),KKT条件是充要条件

    • xx^* 是可行解且满足KKT条件,则 xx^* 是全局最优解
    • xx^* 是全局最优解且满足Slater约束品性(存在严格可行点),则存在拉格朗日乘子使得KKT条件成立
  7. KKT条件的应用与局限性

    应用

    • 可以验证一个解是否可能为最优解
    • 帮助排除可行域中很多不是最优的解
    • 当不容易验证约束品性时,可以先求出所有KKT解,然后从中比较找出最优解

    局限性

    • 有时局部最优点不一定满足KKT条件(当约束品性不满足时)
    • 有些问题的最优解不是KKT解(如例3.3:minx20x\min_{x^2 \leq 0} x,最优解 x=0x=0 不满足KKT条件)
    • 有些问题满足KKT条件的解不存在,但存在最优解(如例3.5:min(x+y2)20xy\min_{(x+y-2)^2 \leq 0} -xy,最优解 x=y=1x=y=1 但不存在KKT解)
  8. 例子

    例1minx20x\min_{x^2 \leq 0} x

    • 最优解为 x=0x=0,约束起作用
    • x=0x=0 处,f1(x)=0\nabla f_1(x) = 0,只有一个全零向量,线性相关,不满足LICQ条件
    • 对于任意 λ0\lambda \geq 0f0(x)+λf1(x)=1+λ0=10\nabla f_0(x) + \lambda \nabla f_1(x) = 1 + \lambda \cdot 0 = 1 \neq 0,无法满足KKT条件
    • 因此最优解不是KKT解

    例2minx20x2\min_{x^2 \leq 0} x^2

    • 最优解为 x=0x=0,约束起作用
    • x=0x=0 处,f1(x)=0\nabla f_1(x) = 0,不满足LICQ条件
    • 但对于任意 λ0\lambda \geq 0f0(x)+λf1(x)=0+λ0=0\nabla f_0(x) + \lambda \nabla f_1(x) = 0 + \lambda \cdot 0 = 0,满足KKT条件
    • 因此虽然不满足LICQ条件,但最优解是KKT解

    例3min(x+y2)20xy\min_{(x+y-2)^2 \leq 0} -xy

    • 该题中满足KKT条件的解不存在
    • 但该题存在最优解 x=y=1x=y=1