人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › winbugs及其他软件专版 › [Julia]Naive Bayes using Julia

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

返回列表

发帖

楼主: Scalachen

1214 4

[Julia]Naive Bayes using Julia [推广有奖]

0关注
0粉丝

本科生

56%

还不是VIP/贵宾

TA的文库 其他...

Haskell NewOccidental

Splunk NewOccidental

Apache Storm NewOccidental

威望: 0 级
论坛币: 5149 个
通用积分: 0
学术水平: 9 点
热心指数: 11 点
信用等级: 9 点
经验: 1156 点
帖子: 24
精华: 1
在线时间: 0 小时
注册时间: 2015-3-29
最后登录: 2017-8-22

楼主

Scalachen 发表于 2015-3-31 21:06:38 |只看作者 |坛友微信交流群|倒序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

# Method of computation
# Assumes it works over 2D arrays
function count_inputs_per_class(Y, C)
# Don't know how to specify type of C
# Anyhow since it's not known at compile time,
# doesn't make a performance difference I suppose
#
# Maybe find a more fancy comprehension way
# to do it one line
N_c = Dict{Any, Int64}()
for y in Y
N_c[y] = haskey(N_c, y) ? N_c[y] + 1 : 1
end
N_c
end
# X - training set inputs
# Y - training set results
# c - class for which tokens qualify
# t - token for which count needs to be taken
function count_tokens_T_in_class(X, Y, c, t)
count = 0
for i = 1:size(X, 1)
if !(Y[i] == c)
continue
end
for x in X[i,:]
if x == t
count += 1
end
end
end #Loop over training set
count
end
function count_tokens_in_class(X, Y, c)
count = 0
for i = 1:size(X, 1)
if (Y[i] == c)
count += length(X[i,:])
end
end #Loop over training set
count
end
# Currently supports only Multinomial Naive Bayes
# TODO: Add optional options hash as 3rd parameter
#
# X - Array containing training set inputs.
# Y - Vector containing training set results. (TODO: Change to vector parameter)
# returns - learned classification function gamma
#
function naive_bayes_fit(X::Array, Y::Array)
V = unique(X)
C = unique(Y)
N = size(X, 1)
N_c = count_inputs_per_class(Y, C)
prior = Dict{Any, Float64}()
#P_T_c = Array(Float64, (length(V), length(C)))
# Might slow down due to the absence of type
P_T_c = Dict()
for c in C
prior[c] = N_c[c] / N
sum_T_ct = count_tokens_in_class(X, Y, c) + length(V)
for t in V
T_ct = count_tokens_T_in_class(X, Y, c, t) + 1
P_T_c[(t, c)] = T_ct / sum_T_ct
end
end
gamma(d) = naive_bayes_predict(prior, P_T_c, C, d)
end
function naive_bayes_predict(prior, P_T_c, C, d)
n_classes = length(C)
scores = Array(Float64, n_classes)
for i = 1:n_classes; c = C[i]
scores[i] = prior[c]
for t in d
if (haskey(P_T_c, (t, c)))
scores[i] += log(P_T_c[(t, c)])
end
end
end
C[indmax(scores)]
end

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：naive Using Bayes Julia baye difference training suppose

本帖被以下文库推荐

· 编程语言(Coding Languages)|主题: 3936, 订阅: 126
· Julia NewOccidental|主题: 108, 订阅: 7

使用道具举报

沙发

Scalachen 发表于 2015-3-31 21:07:35 |只看作者 |坛友微信交流群

X = reshape(rand(0:5, 600), 6, 100)
Y = [1:6]
gamma = naive_bayes_fit(X, Y)
print(gamma(X[1]))

复制代码

使用道具举报

加关注串个门加好友发消息 0关注 463 粉丝巨擘 Nicolle 当前离线阅读权限 255 威望 16 级论坛币 12402428 个通用积分 1621.0115 学术水平 3305 点热心指数 3329 点信用等级 3095 点经验 477211 点帖子 23879 精华 91 在线时间 9878 小时注册时间 2005-4-23 最后登录 2022-3-6 雷达卡	藤椅 Nicolle 发表于 2018-7-17 01:27:27 \|只看作者 \|坛友微信交流群提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报显身卡

加关注串个门加好友发消息 0关注 463 粉丝巨擘 Nicolle 当前离线阅读权限 255 威望 16 级论坛币 12402428 个通用积分 1621.0115 学术水平 3305 点热心指数 3329 点信用等级 3095 点经验 477211 点帖子 23879 精华 91 在线时间 9878 小时注册时间 2005-4-23 最后登录 2022-3-6 雷达卡	板凳 Nicolle 发表于 2018-7-17 01:28:24 \|只看作者 \|坛友微信交流群提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报显身卡

加关注串个门加好友发消息 0关注 463 粉丝巨擘 Nicolle 当前离线阅读权限 255 威望 16 级论坛币 12402428 个通用积分 1621.0115 学术水平 3305 点热心指数 3329 点信用等级 3095 点经验 477211 点帖子 23879 精华 91 在线时间 9878 小时注册时间 2005-4-23 最后登录 2022-3-6 雷达卡	报纸 Nicolle 发表于 2018-7-17 01:29:26 \|只看作者 \|坛友微信交流群提示: 作者被禁止或删除内容自动屏蔽

	回复使用道具举报显身卡