fengbingchun

MXNet中依赖库介绍及简单使用

MXNet是一种开源的深度学习框架，核心代码是由C++实现，在编译源码的过程中，它需要依赖其它几种开源库，这里对MXNet依赖的开源库进行简单的说明：

1. OpenBLAS：全称为Open Basic Linear Algebra Subprograms，是开源的基本线性代数子程序库，是一个优化的高性能多核BLAS库，主要包括矩阵与矩阵、矩阵与向量、向量与向量等操作。它的License是BSD-3-Clause，可以商用，目前最新的发布版本是0.3.3。它的源码放在GitHub上，由张先轶老师等持续维护。

OpenBLAS是由中科院软件所并行软件与计算科学实验室发起的基于GotoBLAS2 1.13 BSD版的开源BLAS库高性能实现。

BLAS是一个应用程序接口(API)标准，用以规范发布基础线性代数操作的数值库(如矢量或矩阵乘法)。该程序集最初发布于1979年，并用于建立更大的数值程序包(如LAPACK)。在高性能计算领域，BLAS被广泛使用。

测试代码如下(openblas_test.cpp)：

#include "openblas_test.hpp"
#include 
#include 

int test_openblas_1()
{
	int th_model = openblas_get_parallel();
	switch (th_model) {
	case OPENBLAS_SEQUENTIAL:
		printf("OpenBLAS is compiled sequentially.\n");
		break;
	case OPENBLAS_THREAD:
		printf("OpenBLAS is compiled using the normal threading model\n");
		break;
	case OPENBLAS_OPENMP:
		printf("OpenBLAS is compiled using OpenMP\n");
		break;
	}

	int n = 2;
	double* x = (double*)malloc(n*sizeof(double));
	double* upperTriangleResult = (double*)malloc(n*(n + 1)*sizeof(double) / 2);

	for (int j = 0; j

 
  执行结果如下： 
   
  2. DLPack：仅有一个头文件dlpack.h。DLPack是一种开放的内存张量(tensor)结构，用于在不同框架之间共享张量，如Tensorflow, PyTorch, NXNet，不发生任何数据复制或拷贝。 
  dlpack.h文件中包括两个枚举类型，四个结构体： 
  枚举类型DLDeviceType：支持的设备类型包括CPU、CUDA GPU、OpenCL、Apple GPU、AMD GPU等。 
  枚举类型DLDataTypeCode：支持的数据类型包括有符号int、无符号int、float。 
  结构体DLContext：A Device context for Tensor and operator，数据成员包括设备类型和设备id。 
  结构体DLDataType：tensor支持的数据类型，数据成员包括code基本类型，值必须为DLDataTypeCode支持的；位数(bits)可以是8,16,32；类型的lanes数。 
  结构体DLTensor：tensor对象，不管理内存。数据成员包括数据指针(void*)、DLContext、维数、DLDataType、tensor的shape、tensor的stride、数据开始指针的字节偏移量。 
  结构体DLManagedTensor：管理DLTensor内存。 
  3. MShadow：全称Matrix Shadow，用C++/CUDA实现的轻量级的CPU/GPU矩阵和tensor模板库。它的文件全部为.h或.cuh，使用时直接include即可。注意：如果在工程属性预处理器定义中没有加入MSHADOW_STAND_ALONE，则需要包括额外的CBLAS或MKL或CUDA的支持。如果不依赖其它库，定义MSHADOW_STAND_ALONE，则会导致有些函数没有实现，如dot_engine-inl.h中，函数体中会包括语句：LOG(FATAL) << “Not implemented!”; 
  这里为了测试不开启MSHADOW_STAND_ALONE宏，仅开启MSHADOW_USE_CBLAS宏。 
  测试代码如下(mshadow_test.cpp)： 
  #include "mshadow_test.hpp"
#include 
#include 
#include "mshadow/tensor.h"

// reference: mshadow source code: mshadow/guide

int test_mshadow_1()
{
	// intialize tensor engine before using tensor operation
	mshadow::InitTensorEngine();

	// assume we have a float space
	float data[20];
	// create a 2 x 5 x 2 tensor, from existing space
	mshadow::Tensor ts(data, mshadow::Shape3(2, 5, 2));
	// take first subscript of the tensor
	mshadow::Tensor mat = ts[0];
	// Tensor object is only a handle, assignment means they have same data content
	// we can specify content type of a Tensor, if not specified, it is float bydefault
	mshadow::Tensor mat2 = mat;
	mat = mshadow::Tensor(data, mshadow::Shape1(10)).FlatTo2D();

	// shaape of matrix, note size order is same as numpy
	fprintf(stdout, "%u X %u matrix\n", mat.size(0), mat.size(1));

	// initialize all element to zero
	mat = 0.0f;
	// assign some values
	mat[0][1] = 1.0f; mat[1][0] = 2.0f;
	// elementwise operations
	mat += (mat + 10.0f) / 10.0f + 2.0f;

	// print out matrix, note: mat2 and mat1 are handles(pointers)
	for (mshadow::index_t i = 0; i < mat.size(0); ++i) {
		for (mshadow::index_t j = 0; j < mat.size(1); ++j) {
			fprintf(stdout, "%.2f ", mat2[i][j]);
		}
		fprintf(stdout, "\n");
	}

	mshadow::TensorContainer lhs(mshadow::Shape2(2, 3)), rhs(mshadow::Shape2(2, 3)), ret(mshadow::Shape2(2, 2));
	lhs = 1.0;
	rhs = 1.0;
	ret = mshadow::expr::implicit_dot(lhs, rhs.T());
	mshadow::VectorDot(ret[0].Slice(0, 1), lhs[0], rhs[0]);
	fprintf(stdout, "vdot=%f\n", ret[0][0]);
	int cnt = 0;
	for (mshadow::index_t i = 0; i < ret.size(0); ++i) {
		for (mshadow::index_t j = 0; j < ret.size(1); ++j) {
			fprintf(stdout, "%.2f ", ret[i][j]);
		}
		fprintf(stdout, "\n");
	}
	fprintf(stdout, "\n");

	for (mshadow::index_t i = 0; i < lhs.size(0); ++i) {
		for (mshadow::index_t j = 0; j < lhs.size(1); ++j) {
			lhs[i][j] = cnt++;
			fprintf(stdout, "%.2f ", lhs[i][j]);
		}
		fprintf(stdout, "\n");
	}
	fprintf(stdout, "\n");

	mshadow::TensorContainer index(mshadow::Shape1(2)), choosed(mshadow::Shape1(2));
	index[0] = 1; index[1] = 2;
	choosed = mshadow::expr::mat_choose_row_element(lhs, index);
	for (mshadow::index_t i = 0; i < choosed.size(0); ++i) {
		fprintf(stdout, "%.2f ", choosed[i]);
	}
	fprintf(stdout, "\n");

	mshadow::TensorContainer recover_lhs(mshadow::Shape2(2, 3)), small_mat(mshadow::Shape2(2, 3));
	small_mat = -100.0f;
	recover_lhs = mshadow::expr::mat_fill_row_element(small_mat, choosed, index);
	for (mshadow::index_t i = 0; i < recover_lhs.size(0); ++i) {
		for (mshadow::index_t j = 0; j < recover_lhs.size(1); ++j) {
			fprintf(stdout, "%.2f ", recover_lhs[i][j] - lhs[i][j]);
		}
	}
	fprintf(stdout, "\n");

	rhs = mshadow::expr::one_hot_encode(index, 3);

	for (mshadow::index_t i = 0; i < lhs.size(0); ++i) {
		for (mshadow::index_t j = 0; j < lhs.size(1); ++j) {
			fprintf(stdout, "%.2f ", rhs[i][j]);
		}
		fprintf(stdout, "\n");
	}
	fprintf(stdout, "\n");
	mshadow::TensorContainer idx(mshadow::Shape1(3));
	idx[0] = 8;
	idx[1] = 0;
	idx[2] = 1;

	mshadow::TensorContainer weight(mshadow::Shape2(10, 5));
	mshadow::TensorContainer embed(mshadow::Shape2(3, 5));

	for (mshadow::index_t i = 0; i < weight.size(0); ++i) {
		for (mshadow::index_t j = 0; j < weight.size(1); ++j) {
			weight[i][j] = i;
		}
	}
	embed = mshadow::expr::take(idx, weight);
	for (mshadow::index_t i = 0; i < embed.size(0); ++i) {
		for (mshadow::index_t j = 0; j < embed.size(1); ++j) {
			fprintf(stdout, "%.2f ", embed[i][j]);
		}
		fprintf(stdout, "\n");
	}
	fprintf(stdout, "\n\n");
	weight = mshadow::expr::take_grad(idx, embed, 10);
	for (mshadow::index_t i = 0; i < weight.size(0); ++i) {
		for (mshadow::index_t j = 0; j < weight.size(1); ++j) {
			fprintf(stdout, "%.2f ", weight[i][j]);
		}
		fprintf(stdout, "\n");
	}

	fprintf(stdout, "upsampling\n");

#ifdef small
#undef small
#endif

	mshadow::TensorContainer small(mshadow::Shape2(2, 2));
	small[0][0] = 1.0f;
	small[0][1] = 2.0f;
	small[1][0] = 3.0f;
	small[1][1] = 4.0f;
	mshadow::TensorContainer large(mshadow::Shape2(6, 6));
	large = mshadow::expr::upsampling_nearest(small, 3);
	for (mshadow::index_t i = 0; i < large.size(0); ++i) {
		for (mshadow::index_t j = 0; j < large.size(1); ++j) {
			fprintf(stdout, "%.2f ", large[i][j]);
		}
		fprintf(stdout, "\n");
	}
	small = mshadow::expr::pool(large, small.shape_, 3, 3, 3, 3);
	// shutdown tensor enigne after usage
	for (mshadow::index_t i = 0; i < small.size(0); ++i) {
		for (mshadow::index_t j = 0; j < small.size(1); ++j) {
			fprintf(stdout, "%.2f ", small[i][j]);
		}
		fprintf(stdout, "\n");
	}

	fprintf(stdout, "mask\n");
	mshadow::TensorContainer mask_data(mshadow::Shape2(6, 8));
	mshadow::TensorContainer mask_out(mshadow::Shape2(6, 8));
	mshadow::TensorContainer mask_src(mshadow::Shape1(6));

	mask_data = 1.0f;
	for (int i = 0; i < 6; ++i) {
		mask_src[i] = static_cast(i);
	}
	mask_out = mshadow::expr::mask(mask_src, mask_data);
	for (mshadow::index_t i = 0; i < mask_out.size(0); ++i) {
		for (mshadow::index_t j = 0; j < mask_out.size(1); ++j) {
			fprintf(stdout, "%.2f ", mask_out[i][j]);
		}
		fprintf(stdout, "\n");
	}

	mshadow::ShutdownTensorEngine();

	return 0;
}

// user defined unary operator addone
struct addone {
	// map can be template function
	template
	MSHADOW_XINLINE static DType Map(DType a) {
		return  a + static_cast(1);
	}
};
// user defined binary operator max of two
struct maxoftwo {
	// map can also be normal functions,
	// however, this can only be applied to float tensor
	MSHADOW_XINLINE static float Map(float a, float b) {
		if (a > b) return a;
		else return b;
	}
};

int test_mshadow_2()
{
	// intialize tensor engine before using tensor operation, needed for CuBLAS
	mshadow::InitTensorEngine();
	// take first subscript of the tensor
	mshadow::Stream *stream_ = mshadow::NewStream(0);
	mshadow::Tensor mat = mshadow::NewTensor(mshadow::Shape2(2, 3), 0.0f, stream_);
	mshadow::Tensor mat2 = mshadow::NewTensor(mshadow::Shape2(2, 3), 0.0f, stream_);

	mat[0][0] = -2.0f;
	mat = mshadow::expr::F(mshadow::expr::F(mat) + 0.5f, mat2);

	for (mshadow::index_t i = 0; i < mat.size(0); ++i) {
		for (mshadow::index_t j = 0; j < mat.size(1); ++j) {
			fprintf(stdout, "%.2f ", mat[i][j]);
		}
		fprintf(stdout, "\n");
	}

	mshadow::FreeSpace(&mat); mshadow::FreeSpace(&mat2);
	mshadow::DeleteStream(stream_);
	// shutdown tensor enigne after usage
	mshadow::ShutdownTensorEngine();

	return 0;
}
 
  其中test_mshadow_2的执行结果如下： 
   
  4. DMLC-Core：全称Distributed Machine Learning Common Codebase，它是支持所有DMLC项目的基础模块，用于构建高效且可扩展的分布式机器学习通用库。 
  测试代码如下(dmlc_test.cpp)： 
  #include "dmlc_test.hpp"
#include 
#include 
#include 
#include 
#include 

// reference: dmlc-core/example and dmlc-core/test

struct MyParam : public dmlc::Parameter {
	float learning_rate;
	int num_hidden;
	int activation;
	std::string name;
	// declare parameters in header file
	DMLC_DECLARE_PARAMETER(MyParam) {
		DMLC_DECLARE_FIELD(num_hidden).set_range(0, 1000)
			.describe("Number of hidden unit in the fully connected layer.");
		DMLC_DECLARE_FIELD(learning_rate).set_default(0.01f)
			.describe("Learning rate of SGD optimization.");
		DMLC_DECLARE_FIELD(activation).add_enum("relu", 1).add_enum("sigmoid", 2)
			.describe("Activation function type.");
		DMLC_DECLARE_FIELD(name).set_default("mnet")
			.describe("Name of the net.");

		// user can also set nhidden besides num_hidden
		DMLC_DECLARE_ALIAS(num_hidden, nhidden);
		DMLC_DECLARE_ALIAS(activation, act);
	}
};

// register it in cc file
DMLC_REGISTER_PARAMETER(MyParam);

int test_dmlc_parameter()
{
	int argc = 4;
	char* argv[4] = {
#ifdef _DEBUG
		"E:/GitCode/MXNet_Test/lib/dbg/x64/ThirdPartyLibrary_Test.exe",
#else
		"E:/GitCode/MXNet_Test/lib/rel/x64/ThirdPartyLibrary_Test.exe",
#endif
		"num_hidden=100",
		"name=aaa",
		"activation=relu"
	};

	MyParam param;
	std::map kwargs;
	for (int i = 0; i < argc; ++i) {
		char name[256], val[256];
		if (sscanf(argv[i], "%[^=]=%[^\n]", name, val) == 2) {
			kwargs[name] = val;
		}
	}
	fprintf(stdout, "Docstring\n---------\n%s", MyParam::__DOC__().c_str());

	fprintf(stdout, "start to set parameters ...\n");
	param.Init(kwargs);
	fprintf(stdout, "-----\n");
	fprintf(stdout, "param.num_hidden=%d\n", param.num_hidden);
	fprintf(stdout, "param.learning_rate=%f\n", param.learning_rate);
	fprintf(stdout, "param.name=%s\n", param.name.c_str());
	fprintf(stdout, "param.activation=%d\n", param.activation);

	return 0;
}

namespace tree {
	struct Tree {
		virtual void Print() = 0;
		virtual ~Tree() {}
	};

	struct BinaryTree : public Tree {
		virtual void Print() {
			printf("I am binary tree\n");
		}
	};

	struct AVLTree : public Tree {
		virtual void Print() {
			printf("I am AVL tree\n");
		}
	};
	// registry to get the trees
	struct TreeFactory
		: public dmlc::FunctionRegEntryBase > {
	};

#define REGISTER_TREE(Name)                                             \
  DMLC_REGISTRY_REGISTER(::tree::TreeFactory, TreeFactory, Name)        \
  .set_body([]() { return new Name(); } )

	DMLC_REGISTRY_FILE_TAG(my_tree);

}  // namespace tree

// usually this sits on a seperate file
namespace dmlc {
	DMLC_REGISTRY_ENABLE(tree::TreeFactory);
}

namespace tree {
	// Register the trees, can be in seperate files
	REGISTER_TREE(BinaryTree)
		.describe("This is a binary tree.");

	REGISTER_TREE(AVLTree);

	DMLC_REGISTRY_LINK_TAG(my_tree);
}

int test_dmlc_registry()
{
	// construct a binary tree
	tree::Tree *binary = dmlc::Registry::Find("BinaryTree")->body();
	binary->Print();
	// construct a binary tree
	tree::Tree *avl = dmlc::Registry::Find("AVLTree")->body();
	avl->Print();

	delete binary;
	delete avl;

	return 0;
} 
  其中test_dmlc_parameter的执行结果如下： 
   
  5. TVM：深度学习系统的编译器堆栈(compiler stack)。它旨在缩小深度学习框架与以性能、效率为重点的硬件后端之间的差距。它与深度学习框架协同工作，为不同的后端提供端到端的编译。TVM除了依赖dlpack、dmlc-core外，还依赖HalideIR。而且编译TVM时，一大堆C2440、C2664错误，即无法从一种类型转换为另一种类型的错误。因为在编译MXNet源码时，目前MXNet仅需要tvm源码nnvm/src下的c_api, core, pass三个目录的文件参与编译，因此后面再调试TVM库。 
  6. OpenCV：可选的，编译过程可参考： https://blog.csdn.net/fengbingchun/article/details/84030309   
  7. CUDA和cudnn：可选的，编译过程可参考：https://blog.csdn.net/fengbingchun/article/details/53892997 
  GitHub：  https://github.com/fengbingchun/MXNet_Test

MikroTik RouterOS 6.49.2 x86_64架构 L6全功能版本伍熠逸Peg
MikroTikRouterOS6.49.2x86_64架构L6全功能版本【下载地址】MikroTikRouterOS6.49.2x86_64架构L6全功能版本这是一个基于MikroTikRouterOS6.49.2的OVA虚拟机版本，专为x86_64架构设计，搭载L6级全功能许可，支持升级至7.x版本。该版本已集成vmxnet3万兆网卡驱动，并支持2GB以上内存，适用于VMwareWorksta
pytorch深度学习入门（12）之-神经网络导出onnx模型部署与应用码农呆呆深度学习深度学习 pytorch 神经网络
概述：ONNX（OpenNeuralNetworkExchange）是一种开放神经网络交换格式，它使得不同深度学习框架（如TensorFlow、PyTorch、MXNet等）之间的互操作成为可能。ONNX提供了一种标准化的方式，可以将训练好的模型导出并转换为ONNX格式，然后可以在其他支持ONNX的框架或工具中进行部署和推理。ONNX的主要优势在于它促进了深度学习模型在不同平台之间的互操作性和可移
《动手学深度学习》-2.1. 数据操作 SSWDUT 动手学深度学习深度学习人工智能
2.1.数据操作为了能够完成各种数据操作，我们需要某种方法来存储和操作数据。通常，我们需要做两件重要的事：（1）获取数据；（2）将数据读入计算机后对其进行处理。如果没有某种方法来存储数据，那么获取数据是没有意义的。首先，我们介绍n维数组，也称为张量（tensor）。使用过Python中NumPy计算包的读者会对本部分很熟悉。无论使用哪个深度学习框架，它的张量类（在MXNet中为ndarray，在P
MXNet深度学习框架入门指南：核心概念与架构解析陆璞朝Jocelyn
MXNet深度学习框架入门指南：核心概念与架构解析mxnet项目地址:https://gitcode.com/gh_mirrors/mx/mxnet什么是MXNetApacheMXNet是一个开源的深度学习框架，它提供了全面而灵活的API来创建深度学习模型。作为现代深度学习的重要工具，MXNet在工业界和学术界都得到了广泛应用。MXNet的核心优势高性能与可扩展性：原生支持多GPU和分布式多主机任
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进陆或愉
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进Dive-into-DL-PyTorch本项目将《动手学深度学习》(DiveintoDeepLearning)原书中的MXNet实现改为PyTorch实现。项目地址:https://gitcode.com/gh_mirrors/di/Dive-into-DL-PyTorch引言目标检测是计算机视觉领域的核心任务之一
解决Linux服务器MXNet安装与`npx`模块问题 cocogogogo 服务器 linux mxnet
解决Linux服务器MXNet安装与npx模块问题背景在Ubuntu18.04服务器上，通过Mac终端在pytorch_env（Python3.9.21）中解决MXNet相关错误，最终实现npx模块使用。问题及解决步骤1.问题：AttributeError:module'numpy'hasnoattribute'bool'环境：MXNet1.5.1，NumPy1.24.4。原因：NumPy1.20
EXO：模型最终验证的地方；infer_tensor；step；MLXDynamicShardInferenceEngine ZhangJiQun&MXP 2024大模型以及算力 2021 AI python 教学语言模型 transformer 人工智能
目录EXO：模型最终验证的地方EXO：infer_tensorEXO:stepMXNet的mx.array类型是什么NDArray优化了什么1.异步计算和内存优化2.高效的数学和线性代数运算3.稀疏数据支持4.自动化求导举例说明EXO：模型最终验证的地方EXO：infer_tensor这段代码定义了一个名为infer_tensor的异步方法，它属于某个类（虽然类名未在此代码段中给出）。这个方法的目
深度学习模型优化与行业应用新突破智能计算研究中心其他
内容概要当前深度学习模型优化正经历多维技术革新，核心突破集中在算法效率与场景适配性提升。以自适应学习优化和超参数调优为代表的动态调整机制，显著降低了模型训练对人工经验的依赖。主流框架如MXNet与PyTorch在分布式计算、自动微分等关键能力上形成差异化优势（见表1），而边缘计算与联邦学习的融合，则通过本地化数据处理与隐私保护机制，为医疗影像诊断、金融风险预测等高敏感场景提供了可信部署方案。框架特
模型优化技术驱动行业应用创新智能计算研究中心其他
内容概要当前模型优化技术正通过多维度创新重构行业应用版图。从底层框架演进看，TensorFlow、PyTorch与MXNet等主流工具通过自适应学习机制与参数化建模能力，显著提升了模型训练效率；而在技术融合层面，联邦学习与边缘计算的协同部署方案，为解决数据隐私与算力瓶颈提供了新范式。与此同时，量子计算驱动的新型优化算法正突破传统数学模型的性能边界，结合可解释性增强与超参数动态调整策略，使医疗诊断、
智能模型优化趋势与行业实践突破智能计算研究中心其他
内容概要当前智能模型优化技术正沿着多维度路径加速演进，其中自动化机器学习（AutoML）与可解释性模型的融合成为降低技术门槛的核心方向。从技术演进路径来看，边缘计算与联邦学习的结合显著提升了分布式场景下的模型效率，而量子计算的引入则为复杂优化问题提供了突破性思路。与此同时，MXNet、PyTorch等主流框架在动态计算图与分布式训练方面的创新，进一步推动了行业模型的快速迭代。为系统呈现技术趋势与实
模型优化技术演进与行业场景突破智能计算研究中心其他
内容概要模型优化技术正经历从算法改进到系统级创新的范式跃迁。随着自动化机器学习（AutoML）与联邦学习技术的成熟，模型开发效率与隐私保护能力显著提升，而模型压缩技术则推动轻量化部署在边缘计算场景中加速落地。与此同时，量子计算为优化算法提供了新的计算维度，MXNet、PyTorch等框架通过动态计算图特性，在医疗影像识别和语音交互领域实现推理速度的突破性进展。技术演进阶段核心技术突破典型应用场景主
智能模型优化与跨行业应用趋势智能计算研究中心其他
内容概要智能模型优化技术正经历多维度的范式突破，从算法架构到部署模式均呈现显著变革。核心演进路径涵盖三大维度：在技术层，自动化机器学习（AutoML）与自适应学习优化技术大幅降低建模门槛，结合超参数优化与正则化方法，实现模型性能与效率的平衡；在架构层，边缘计算与联邦学习推动分布式模型部署，MXNet、PyTorch等框架通过模型压缩与量化技术，适配低功耗设备部署需求；在应用层，医疗诊断、金融预测等
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
AI模型技术前沿与跨场景应用实践智能计算研究中心其他
内容概要当前AI模型技术正呈现多维度突破与跨领域融合的特征。从技术演进角度看，可解释性模型与量子计算框架的协同发展正在突破传统黑箱限制，而联邦学习、自适应优化等技术则为复杂场景建模提供了新的方法论支撑。应用层面，TensorFlow与PyTorch框架在医疗影像诊断、金融时序预测等领域的实战案例，验证了深度学习模型在垂直行业的泛化能力。值得关注的是，工具链整合已成为技术落地的关键环节，MXNet与
AI学习预备知识-数据操作（5）内存节省羞涩的小吉他 AI开发学习之路人工智能学习
AI学习预备知识-数据操作（5）内存节省提示：本系列持续更新中文章目录AI学习预备知识-数据操作（5）内存节省前言内存节省总结前言随着开始人工智能的学习越来越多，那么再学习过程中，我们应该有一定的基础知识储备，本系列为基础知识储备介绍，本文主要讲解AI学习储备知识–在数据操作过程中所需考虑到的内存节省。内存节省提示：默认使用python，数据操作使用mxnet在数据操作过程中运行一些操作可能会导致
蚂蚁集团可转正实习算法岗内推-自然语言飞300 业界资讯自然语言处理
具备极佳的工程实现能力，精通C/C++、Java、Pvthon、Perl等至少一门语言:对目前主流的深度学习平台:tensorflow、pytorch、mxnet等，至少对其中一个有上手经验;熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验;有强烈求知欲，对人工智能领域相关技术有热情，内推链接：https://u.ali
跨框架模型演进与行业应用路径智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，模型框架的演进与行业应用的深度融合已成为推动产业智能化升级的核心驱动力。本文系统性梳理TensorFlow、PyTorch、MXNet等主流框架的技术发展脉络，重点分析其从通用计算架构向多模态、轻量化方向的转型路径。同时，针对模型优化技术领域，深入探讨迁移学习、超参数调优及模型压缩等方法的创新突破，揭示其在降低计算资源消耗、提升推理效率方面的关键作用。在行业
Java部署机器学习模型:方案二(基于DJL) iiilloi 机器学习 spring spring boot
DJL（DeepJavaLibrary）是由亚马逊公司开发的一款开源的深度学习框架，它旨在为Java开发人员提供一个简单而强大的API，使得在Java中使用深度学习变得更加容易。DJL有以下几个方面优势：支持多个底层引擎DJL支持多个底层引擎，包括MXNet、TensorFlow和PyTorch等。这使得DJL可以在多个平台上使用，包括Java、Android、iOS和RaspberryPi等。易
Apache MXNet：灵活高效的深度学习库零度° python 深度学习 apache mxnet
ApacheMXNet是一个开源的深度学习框架，适用于灵活的研究原型设计和生产。它提供了一个混合前端，可以无缝地在Gluon（动态图）和Symbolic（静态图）模式之间转换，以提供灵活性和速度。MXNet支持多种语言绑定，包括Python、Scala、Julia、Clojure、Java、C++、R和Perl，并且拥有一个活跃的工具和库生态系统，可以扩展MXNet的功能，支持计算机视觉、自然语言
Apache MXNet 深度学习框架教程娄妃元Kacey
ApacheMXNet深度学习框架教程mxnetLightweight,Portable,FlexibleDistributed/MobileDeepLearningwithDynamic,Mutation-awareDataflowDepScheduler;forPython,R,Julia,Scala,Go,Javascriptandmore项目地址:https://gitcode.com/g
Ubuntu为julia安装深度学习框架MXNet（支持CUDA和OPenCV编译）盼小辉丶 julia 深度学习 cmake linux mxnet julia language 深度学习
Ubuntu为julia安装深度学习框架MXNet（支持CUDA和OPenCV编译）环境介绍与注意事项下载源文件安装依赖编译环境配置安装MXNet测试后记环境介绍与注意事项Ubuntu18.04julia1.5.3CUDA10.1（为了GPU支持，需要安装CUDA和cudnn，可以参考博客，若CUDA版本不同，参考此网站下载合适的MXNet版本）安装MXNet的julia绑定，经过多次测试，并不能
MXNet深度学习框架：高效与灵活性的结合原机小子深度学习 mxnet 人工智能
标题：MXNet深度学习框架：高效与灵活性的结合MXNet是一个由Apache软件基金会支持的开源深度学习框架，以其高效性能和灵活性而闻名。它最初由亚马逊团队开发，并于2015年开源，迅速成为深度学习领域的一个重要工具。MXNet支持多种编程语言，包括Python、Java、Scala、R、C++等，能够运行在CPU、GPU和云平台上，满足不同场景下的需求。1.MXNet的核心特性MXNet的主要
【单层神经网络】基于MXNet的线性回归实现（底层实现）辰尘_星启线性回归 mxnet 机器学习人工智能深度学习神经网络 python
写在前面刚开始先从普通的寻优算法开始，熟悉一下学习训练过程下面将使用梯度下降法寻优，但这大概只能是局部最优，它并不是一个十分优秀的寻优算法整体流程生成训练数据集（实际工程中，需要从实际对象身上采集数据）确定模型及其参数（输入输出个数、阶次，偏置等）确定学习方式（损失函数、优化算法，学习率，训练次数，终止条件等）读取数据集（不同的读取方式会影响最终的训练效果）训练模型完整程序及注释fromIPyth
线性回归的简单实现 SkaWxp 深度学习深度学习机器学习 mxnet gluon
本文是《动手学深度学习》的笔记文章目录线性回归的简单实现生成随机数据集读取数据初始化模型参数定义模型定义损失函数定义优化算法训练模型线性回归的简洁实现生成数据集读取数据定义模型初始化模型参数定义损失函数定义优化算法训练模型线性回归的简单实现用了mxnet中的自动求导和数组结构frommxnetimportautograd,ndimportrandom生成随机数据集只有这个是用了自己造的数据，因为线
Task01：线性回归；Softmax与分类模型、多层感知机恰人陈 pytorch 机器学习深度学习神经网络
一、mxnet相关函数用法mxnet.nd用法对标numpy库(1)nd.concatfrommxnetimportndnd.concat(X,Y,dim=0)nd.concat(X,Y,dim=1)X,Y为两个矩阵nd.concat为连接矩阵，dim表示连接的维度，若原来两个矩阵为（4,3），dim=0就表示新生成矩阵为（8,3）dim=1表示新生成矩阵为（4,6）(2)y+=xy=y+x这样的
【单层神经网络】基于MXNet库简化实现线性回归辰尘_星启神经网络 mxnet 线性回归
写在前面同最开始的两篇文章完整程序及注释'''导入使用的库'''#基本frommxnetimportautograd,nd,gluon#模型、网络frommxnet.gluonimportnnfrommxnetimportinit#学习frommxnet.gluonimportlossasgloss#数据集frommxnet.gluonimportdataasgdata'''生成测试数据集'''#
线性回归基础学习 Remoa 人工智能线性回归优化 gluon mxnet loss
线性回归基础学习目录：理论知识样例代码测试参考文献一、理论知识线性回归思维导图NDArray：MXNet中存储和变换数据的主要工具，提供GPU计算和自动求梯度等功能线性回归可以用神经网络图表示，也可以用矢量计算表示在Gluon中，data模块提供了有关数据处理的工具，nn模块定义了大量神经网络的层，loss模块定义了各种损失函数在MXNet的init模块(initializer)提供了模型参数化的
《动手学深度学习》(PyTorch版) chaser&upper 深度学习 pytorch 深度学习 python
《动手学深度学习》PyTorch版前言简介面向人群食用方法方法一方法二方法三目录原书地址引用阅读指南前言读书啦！！！本项目将《动手学深度学习》原书中MXNet代码实现改为PyTorch实现。原书作者：阿斯顿·张、李沐、扎卡里C.立顿、亚历山大J.斯莫拉以及其他社区贡献者，GitHub地址：https://github.com/d2l-ai/d2l-zh此书的中英版本存在一些不同，针对此书英文版的P
使用onnxruntime-web 运行yolov8-nano推理 CHEN_RUI_2200 机器学习 YOLO
ONNX（OpenNeuralNetworkExchange）模型具有以下两个特点促成了我们可以使用onnxruntime-web直接在web端上运行推理模型，为了让这个推理更直观，我选择了试验下yolov8识别预览图片：1.跨平台兼容性ONNX是一种开放的格式，可以在不同的深度学习框架之间共享模型，如PyTorch、TensorFlow、MXNet和Caffe2。这使得用户可以在一个框架中训练模
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

MXNet中依赖库介绍及简单使用

你可能感兴趣的:(MXNet)