R软件是一款功能强大的统计软件,而且是开源项目,所以如果没有银子买SAS这样的系统的时候, R软件是最好的选择。但是不要以为免费的东西就是粗制滥造,R软件绝对不逊色与其它众多的商业统计软件,同Linux一样,拥有众多支持者的R软件一直在成长,不断的有新的软件包加入到R软件的程序库里。到目前为止,R软件的软件包覆盖了统计计算的所有领域,从传统的回归分析到前沿的金融时间序列分析都有。
C#是Microsoft公司推出的新一代程序编程语言,不仅是纯粹的面向对象,而且在VS 2005的支持下,拥有快速开发应用程序的能力,集成了大量的控件,不论是开发Windows程序,还是开发Web应用,均相当出色。所以,使用C#来开发我们的应用,是明智的选择。
统计模型在开发应用的过程中,特别是对银行、证卷和保险这些行业,都有着非常广泛的应用。不过,对于这些行业的从业者而言,掌握行业知识、统计知识和计算机能力的人很少。即使拥有这些能力,做这些工作也是相当耗费精力和时间的。所以开发出这些行业有针对性的行业软件就非常的重要。除了能够降低使用门槛,减轻工作负担以外,关键是能够跟即时。快速的对市场和行情做出决策是相当重要的。利用C#做应用程序,R软件做后台的统计分析,这是我们的想法。试想如果自己用代码去实现一个简单的统计回归,检验分析,绝对不是一件容易的事情。
在C#中怎样调用R软件呢。R软件不只是一种统计工具,它还是一种语言,就语法形式而言跟S语言非常相识。所以类似与数据库一样,在客户端不是就只能调用一些函数,而是可以用数据库提供的SQL语言编写出拥有灵活多变,满足各种需求的功能。R语言也一样,可以在客户端,用S语言编写程序,传送到R软件,R软件计算完成后将结果在传回C# 。既然需要来回传送,必然需要中间的桥梁,就像数据库需要驱动程序一样,在C#中调用R软件,需要安装R(D)COM,R(D)COM是一种DCOM组件,可以注册到Windows的组件服务中,供程序调用。如果用C#开发Web程序,由于ASP.NET是用ASPNET这个用户在执行,而这个用户的权限很低,所以如果要调用R(D)COM的服务的化,需要给ASPNET授予权限。
所有具体的操作,使用方法,可以参考:
http://www.codeproject.com/KB/cs/RtoCSharp.aspx
下面是一个具体例子:
using System;
using System.Configuration;
namespace Common.Regression
{
/**//// <summary>
/// IRegression 回归类接口
/// </summary>
public interface IRegression
{
double[,] Data
{
get;
set;
}
RegressionSummary Summary
{
get;
}
void DoRegression();
void ReleaseLock();
}
}
using System;
using STATCONNECTORSRVLib;
using RServerManager;
using System.Threading;
namespace Common.Regression
{
/**//// <summary>
/// BaseRegression 回归抽象基类
/// </summary>
public abstract class BaseRegression : IRegression
{
private static ServerPool mServerPool = null;
private ServerItem mServerItem = null;
private IStatConnector mStatConnector = null;
private static string mKey = "R";
private static string mClient = "this is client";
private static int mWaitTime = 50;
private static int mMaxLoop = 20;
private static int mMaxServerCount = 5;
private static int mServerCount = 0;
static BaseRegression()
{
if (mServerPool == null)
{
mServerPool = new ServerPool();
}
}
private double[,] mData;
public double[,] Data
{
get
{
return mData;
}
set
{
mData = value;
}
}
private RegressionSummary mSummary;
public RegressionSummary Summary
{
get
{
return mSummary;
}
set
{
mSummary = value;
}
}
/**//// <summary>
/// 执行回归函数
/// </summary>
public abstract void DoRegression();
/**//// <summary>
/// 得到执行R代码的连接
/// </summary>
/// <returns></returns>
protected IStatConnector GetStatConnector()
{
mServerItem = mServerPool.GetServerExclusive(mKey, Client);
int count = 0;
while (mServerItem == null)
{
if (mServerCount < mMaxServerCount)
{
//当小于最小服务器数目时,增加连接
mStatConnector = new StatConnectorClass();
mStatConnector.Init(mKey);
mServerPool.Add(mStatConnector, mKey);
mServerCount++;
mServerItem = mServerPool.GetServerExclusive(mKey, mClient);
break;
}
if (count < mMaxLoop)
{
Thread.Sleep(mWaitTime);
count++;
mServerItem = mServerPool.GetServerExclusive(mKey, mClient);
}
else
{
return null;
}
}
mStatConnector = mServerItem.Server;
return mStatConnector;
}
/**//// <summary>
/// 释放锁定
/// </summary>
public void ReleaseLock()
{
if (mServerItem != null)
{
mServerItem.ReleaseLock();
}
}
public BaseRegression()
{
}
}
}
using System;
using System.Data;
using System.Configuration;
using STATCONNECTORSRVLib;
namespace Common.Regression
{
/**//// <summary>
/// LogicRegression 利用Logistic模型进行回归
/// </summary>
public class LogisticRegression : BaseRegression
{
private IStatConnector mStatConnector;
public LogisticRegression()
{
mStatConnector = GetStatConnector();
}
public override void DoRegression()
{
if (Data == null)
{
return;
}
mStatConnector.SetSymbol("dd", Data);
mStatConnector.EvaluateNoReturn("Y <- dd[,1]");
mStatConnector.EvaluateNoReturn("X <- dd[,-1]");
mStatConnector.EvaluateNoReturn("gr<-glm(Y~X , family=binomial(logit))");
mStatConnector.EvaluateNoReturn("ss<-summary(gr)");
Summary = new RegressionSummary(mStatConnector);
}
}
}