-Java forEach中 Lambda Expr中的 final变量要求

本文是关于 -Java Lambda Expression在forEach方法的应用讨论。对比其他编程语言的foreach 操作(文末附带7种主要编程语言的Loop HashMap by forEach的程序片段),Java 8引入的运用 Lambda Expression方式的 forEach操作方法是最接近语言所要表达的本意,且简洁、直接。
在持续优化 -GWA2 in -Java 过程中,由于 -GWA2 多层结构设计,层间数据传递很多依赖Map/HashMap完成,经常用到这个 forEach 并碰到一些问题(引入外部变量,有条件筛选及终止等),兹记录相关探索过程如下。

通常在 -Java 中遍历一个数据集合是常见的操作场景,比如遍历数组 (-R/G2ST ):

int[] numbers = 
             {1,2,3,4,5,6,7,8,9,10};
for (int item : numbers) {
    System.out.println("Count is: " + item);
}

再比如常规的借助 keySet遍历一个key-value结构的 Map / Hash, 哈希 (-R/k2SP ):

for (KeyType key : m.keySet()){
    System.out.println(key+", "+m.get(key));
}

-R/k2SP 列举了三种方法进行遍历key-value 的Map, 实际上根据 -R/92SS  页面上第二个回答所进行的测试,大概有十多种方法可以实现遍历一个 key-value 的Map. 这么多方法中,又以 forEach 的表达最为直接、高效,所以推荐使用 Map.forEach .

forEach 本质上是建造一个 Lambda Expression 并进行运算,其中 Map.forEach 等同的表达式也是针对  keySet的调用( -R/V2SQ )。

//- Map.forEach is equivalent to:
for (Map.Entry<K, V> entry : map.entrySet()) action.accept(entry.getKey(), entry.getValue());

//- an example
HashMap<String, Integer> hm = new HashMap<String, Integer>();
hm.forEach((key, val)->{
    System.out.println(key+”, “+val);
    });

由于 Lambda Expression 是一个 enclosing scope,它与代码区块外的沟通成为问题,外部变量无法在 Lambda 内部调用,内部变量也无法在外部访问到。在这近乎隔离的运行时环境里,还留了final变量可以穿行的缝隙,如果要实现将Lambda Expr与外部变量进行数据交换,就需要在代码区块外部定义final类型变量作为数据信息载体。常见的应用有如下两个场景.

  1. 将Map/HashMap的数据遍历并加工
    例子程序:

    HashMap<String, Integer> hm = new HashMap<String, Integer>();
    final HashMap<String, Integer> hm2 = new HashMap<String, Integer>();
    hm.forEach((key, val)->{
        System.out.println(key+”, “+val);
        hm2.put(key, val + 1);
        });

    借助 Lambda Expression 对 final变量的支持,可以容易地将遍历并加工后的数据中转取出做进一步的操作.
    final 变量由于无法再次出现在赋值语句的左边,也即无法对对象做再次赋值操作。但这不影响我们后续将 hm2的值进行遍历或者将其复制到另外一个非final的对象中去,如上例中的 hm.
    同样地,作为final的 hm2 无法整体被赋值,但可以对其本身进行操作,如上例中的,通过 hm2.put 将某个元素放入这个容器中。类似的还有,比如 StringBuffer 的操作。

    StringBuffer pageIdsb = new StringBuffer(“0”);
    pageList.forEach((k, v)->{
        HashMap tmphm = (HashMap)v;
        pageIdsb.append(“,”).append(tmphm.get(“id”));
        });

    public final class StringBuffer
    extends Object
    implements Serializable, CharSequence

    由 StringBuffer 类的定义(-R/V2SQ ),我们知道其是 final 类,于是在初始化后,可以在 Lambda Expr中通过 pageIdsb.append 的方式进行其值的操作与变化。

  2. 有条件过滤或推出、终止遍历
    在遍历Map/HashMap等对象集合时,有时候需要有条件的过滤或者终止,如果将外部约束条件带入?
    又如何定义内部自循环变量?
    一种可行的方式,依然是使用 final变量,然后基本变量类型,如果定义为final之后则不能被直接修改,无法满足循环体内计数的需求.
    于是就需要设计一个复合final类的变量,其成员一个负责约束条件,另外一个负责循环计数。

    HashMap<String, Integer> hm = new HashMap<String, Integer>();
    final HashMap<String, Integer> hm2 = new HashMap<String, Integer>(){{
        put(“iCount”, 0);
        put(“maxCount”, 4);
        }};
    hm.forEach((key, val)->{
        int iCount = Wht.parseInt(hm2.get(“iCount”));
        int maxCount = Wht.parseInt(hm2.get(“maxCount”));
        if(iCount < maxCount){
            System.out.println(key+”, “+val);
        }
        hm2.put(“iCount”, iCount + 1);
        });

    在上面的例子程序中,我们定义了循环体内计数变量 iCount 和 满足退出条件 maxCount 每次循环时取出并做对比,每次循环时, iCount++ 。
    上面例子程序中的 Wht.parseInt 是 -GWA2 的基础设施类,可以在 -GWA2@Github (-R/h2SO )下载到.
    上面例子程序中的hm2 的声明实例中,通过构造方法并以一个匿名类完成了两个 put操作。关于匿名类 Anonymous Class,参考 -Java 文档(-R/i2SP ), 在 -GWA2 in -Java 里也有不少应用。
     

-Java 中引入的 forEach 操作,尽管是以 Lambda Expression为载体的一个 Consumer / BiConsumer对象,运行在一个 enclosing scope,依靠可以外部 final 变量这个渠道,可以提供媲美其他编程语言一样的 foreach 效果,对增加程序可读性、可维护性有一定的帮助,已有的评测 forEach也表现出不错的性能,值得更多地应用。

 

-GWA2 是”通用网络应用架构( General Web Application Architeture )”,基于 -GWA2 可以轻便构建各种网络应用程序,
包括复杂的在线购物商城、 旅游交易平台、社群或者社交网站和新闻资讯网站等,
也包括各种企事业单位网上门户,在线交互及服务作业系统等.
还可以包括为NativeApp做服务器端支持, 甚至是WebApp的全部.
-GWA2 是为数不多的支持跨开发语言的应用框架,目前支持 -Java, -PHP, -Perl, -Aspx and -Python .

-GWA2 is a “General Web Application Architecture” and based on -GWA2 developers can easily build a variety of network applications,
including complex online shopping malls, travel trading platforms, community or social networking sites and news information sites, etc.
Also the applications include various online portals of enterprises and institutions, online interaction and service operations systems.
Moreover it contains server-side support for NativeApp, or even all of the WebApp.
-GWA2 is one of the web frameworks which provide cross-language support for -Java, -PHP, -Perl, -Aspx and -Python at present.

-GWA2 is E.A.S.Y 
Easy Along, Swift Yield
轻松启动, 快速产出.


(1) Loop HashMap in PHP ****

$hm = array(“a”=>1, “b”=>2, “c”=>3);
foreach($hm as $key=>$val){
    print “key:$key , val:$val\n”;
}

(2) Loop HashMap in Perl ***

my %hm = (“a”=>1, “b”=>2, “c”=>3);
foreach my $key (keys %hm){
    my $val = $hm{$key};
    print “key:$key , val:$val\n”;
}

(3) Loop HashMap in Swift *****

let hm = [“a”:1, “b”:2, “c”:3];
for (key, val) in hm {
    print(“key:\(key) , val:\(val)\n”);
}

(4) Loop HashMap in Python ***

hm = {“a”:1, “b”:2, “c”:3};
for key in hm:
    print(“key:{} , val:{}”.format(key, hm[key]));

(5) Loop HashMap in C++ *

std::map<std::string, std::int> hm {
    {“a”, 1},
    {“b”, 1},
    {“c”, 3}
};
for(const auto& key : hm){
    std::cout << “key:” << key.first
        << ” , val:” << key.second
        << “\n”;
}

(6) Loop HashMap in JavaScript ***

var hm = {“a”:1, “b”:2, “c”:3};
for (var key in hm){
    console.log(“key:”+key+” , val:”+hm[key]);
};

(7) Loop HashMap in Java ***

HashMap<String, Integer> hm = new HashMap<String, Integer>(){{
    put(“a”, 1″);
    put(“b”, 2);
    put(“c”, 3);
}};
hm.forEach((key, val)->{
    System.out.println(key+”, “+val);
    });

 

发表在 -GWA2, 编程技术, 计算机技术 | 标签为 , , , , , | 留下评论

UfqiNews有福常在Google Books亮月亮科技Apache Softwares

参观“纪念马克思诞辰200周年主题展览”有感, Karl max, 200 Ani Exhi

2018年6月28日下午,在北京位于天安门广场东侧的国家博物馆参观了正在展出的“真理的力量——纪念马克思诞辰200周年主题展览”。

国家博物馆门口人潮涌动,工农商学兵各界,东西南北中各地的人群络绎不绝前来参观学习。主题展览位于国家博物馆的南区1、2和3号馆。入口处即是巨幅卡尔马克思的幕墙,然后映入眼帘的是卡尔马克思和弗恩格斯的合影铜像。各厅内展出了大量图像、史料、实物和相关人物,真实再现了卡尔马克思波澜壮阔的精彩人生,全面生动展示了马克思的生平、革命实践、理论贡献和精神境界,展现了马克思主义在中国传播运用和丰富发展的光辉历程。

或许是由于时序的关系,在领略其出生、成长、成才、奋斗、贡献等各个精彩的人生篇章后,当我驻足在卡尔马克思辞世的那副巨型油画前时,思绪感慨万千,久久未曾移开。

这副油画作者是当代著名艺术家艾中信先生。为纪念马克思诞辰200周年,艾中信创作了这幅油画《三月十四日》(1883年3月14日),再现了马克思在躺椅中溘然长逝的凝固瞬间。艾中信师从和追随徐悲鸿、吴作人等第一代油画大师,是我国的杰出画家、艺术家。

触动我的情感和思绪并引发我共鸣和思考的是这副油画的几个细节:老人、沙发、毛毯和掉落在地上的书籍。这无疑给人一种安详的感觉,作为全人类最为著名的无神论领袖之一,卡尔马克思辞世的瞬间却生动而自然地呈现了无疾而终天人合一至善至美的景象。

根据弗恩格斯后来在《在马克思墓前的讲话》中的细节描述,“3月14日下午两点三刻,当代最伟大的思想家停止思想了。让他一个人留在房里还不到两分钟,当我们进去的时候,便发现他在安乐椅上安静地睡着了——但已经永远地睡着了。”

卡尔马克思及其创建的共产主义是坚定的无神论者。如果不是因为这个,他的离世确切地符合佛教中的得道高僧的“圆寂”,这通常是一个人的大福报,是灵魂的得道升仙,成就不死的永恒。也许正是因为他的奋斗的一生、奉献的一世而得到上帝的垂怜或者眷顾,能够做到自然而然地油尽灯枯、溘然长逝,仿佛睡着了一般,永远地。

作为无神论者,显然不能这样推演。然而从唯物主义历史观出发,似乎有两个结论可以推测出来。一是,卡尔马克思对自身的内省认识,对个体生命的整体观念;二是弗恩格斯及其他卡尔马克思的亲密团队对生命的认识,对人生的思考。

与我们现在经常在新闻传播中听到、读到或者看到的领导人逝世,离得最近的词语就是“因病医治无效,于某某医院离世”。卡尔马克思的辞世时,为何是在家里,躺在沙发上,盖着毛毯,捧着书本? 这是多么享受的一幕,多么安详的画面,仿佛我们每个人都曾经历或者经常体验的那样——某个慵懒的午后,躺在自家的沙发上,看了一会书,然后就倦意袭来,昏昏睡去……

也许可以推测,卡尔马克思本人已经对生死有某种超然脱然的认识,所以当生命的终点或者尽头来临时,他选择的是待在自己熟悉的、温暖的家里,以自己舒服的姿势、读着自己喜欢的书,以此沉沉永远地睡去。

正是基于这一对生命的超脱认识,他选择了以家作为终点,而不是“于某某医院离世”。

其二,弗恩格斯及其他亲密团队成员,充分尊重卡尔马克思的选择,没有强行在卡尔马克思有生命危险时进行重度医疗。可以设想,以当时卡尔马克思的社会声望及地位,如果他需要医疗,可以召来全世界当时最好的医生团队,进行各种极其高精尖的治疗。

显然,卡尔马克思没有要求,甚至可以说是拒绝了进一步的治疗,信奉进化论的他懂得生死更替的大自然的规律。同时,他身边的人,也理解到这一点,并给予充分的尊重。我们无法还原每一个细节,甚至还没有充分的史料来表述与支持这些推测的想法,只能说这些或更贴近已经看到的这副油画。又或许这副油画是艺术的加工,当其时情景并不是那么和谐,这些都不重要了。

如果可以再多一些佐证的话,可以考虑近几年前离世的美国苹果公司的创始人之一史提夫乔布斯先生,当时他被诊断出某种疾病,但他淡然的接受并放弃过度医疗,自然地离去。史提夫乔布斯当时位列全球富人榜前列,以他的社会声望与财富,以近两百年后的不断进步的医学技术,他本应可以续命好多年,然而他却选择了放弃。

个体生命或许是相同的,思想的高度应是差异巨大的,尤其是在庸俗、平凡与卓越、领袖之间。这种巨大的差异不单体现在辉煌的事业上,亦表征在挥别这个美好世界的一刻。

发表在 社会生活 | 标签为 , , , , | 留下评论

捐助乌克兰Help Ukraine老板选址BossXuanzhiUfqiFina有福金融UfqiWork有福工坊

SQL查询优化: 既有Unique Index为何还要另加Index?

在使用 -GWA2 进行WebApp开发时,我们创建基于MySQL的相关数据表时,都会有意识地在数据表的关键字段上增加索引,以期待查询时能够较快地返回结果集。

在我们现有的生产线上的数据观测中,同样一张数据表,通常当数据达到10M+时,如果某个待检索字段(用在Where里作为查询字段)没有使用索引,一次查询大约需要耗时50s+,如果增加了相应的索引,则单次查询大约耗时5s左右,性能提升10倍以上。

所以,理论联系实际,我们都应该在相关待检索的字段上增加索引,这次要提及和澄清的是增加Unique Index还是Index? 只增加Unique Index,还是Index即可?或者两种Index都需要? 在检索方面,Unique Index保持了数据的唯一性,实际兼有Index的功能,在被检索时提供同样的优化性能。

情况稍微复杂一些的例子是这样,当一个Unique Index增加到多个字段的组合上时,其Index的作用并不能想当然地将Index效果追加到每一个组合中的字段上。如下是 -MySQL 官方文档对于组合字段的Unique Index的描述。

-R/u2SN  ) “If the table has a multiple-column index, any leftmost prefix of the index can be used by the optimizer to look up rows. For example, if you have a three-column index on (col1, col2, col3), you have indexed search capabilities on (col1)(col1, col2), and (col1, col2, col3).
MySQL cannot use the index to perform lookups if the columns do not form a leftmost prefix of the index. ”

用简略地话来说,Unique Index的Index作用:1)当只有一个字段时,其Index作用也同样地施加到该字段上;2)当为多个字段的组合时,其Index的作用,只施加到组合的第一个字段上。

所谓差之毫厘,谬之千里。当待检索的字段是某个Unique Index的组合字段之一,且不是第一个时,被用做Where的查询条件,查询性能将急剧下降,每次皆是全表扫描,逐行对比。

这种性能隐患,在开发初期并不容易发现,只有当数据量级增长到10M+时,查询耗时才会逐步显现出来。

 

gwa2-logo-201606.v2

-GWA2 是”通用网络应用架构( General Web Application Architeture )”,基于 -GWA2 可以轻便构建各种网络应用程序, 
包括复杂的在线购物商城、 旅游交易平台、社群或者社交网站和新闻资讯网站等, 
也包括各种企事业单位网上门户,在线交互及服务作业系统等. 
还可以包括为NativeApp做服务器端支持, 甚至是WebApp的全部.
-GWA2 是为数不多的支持跨开发语言的应用框架,目前支持 -Java, -PHP, -Perl, -Aspx and -Python .
-GWA2 is a “General Web Application Architecture”, and based on -GWA2 developers can easily build a variety of network applications,
Including complex online shopping malls, travel trading platforms, community or social networking sites and news information sites, etc.
Also the applications include various enterprises and institutions online portals, online interaction and service operations systems.
And it also includes server-side support for NativeApp, or even all of the WebApp.
-GWA2 is one of the web frameworks which provide cross-language support for -Java, -PHP, -Perl, -Aspx and -Python at present.

-GWA2 is E.A.S.Y 
Easy Along, Swift Yield
轻松启动, 快速产出. 

发表在 -GWA2, 服务器运维, 计算机技术 | 标签为 , , , , , | 留下评论

医用外科口罩一次性医疗专用口罩防尘透气成人三层防护透气医生床上电脑桌大学生宿舍上铺懒人可折叠小桌子家用寝室简约学习书桌京东制作护发素发膜正品修复干枯免洗家用护发补水顺滑女士发热焗油膏

Apache-Tomcat: 虚拟主机VirtualHosts

接续此前的 “嘗試 Apache + Apache Tomcat (簡稱 Tomcat)融合” , -R/H2SL ,和 第二篇,“apache tomcat: mod_jk missing uri map”, -R/n2SK ,  这次叙述一下在 Apache 和 Tomcat 下融合搭配虚拟主机 Virtual Hosts的事, 顺带回应前述,为何技术选型是 Apache + Tomcat ,而不是 Nginx + Resin ?

1. 为何选用“Apache + Tomcat”?
单一就性能而言, Ningx 在服务静态页面胜过 Apache , Resin 在服务动态页面上胜过 Tomcat,那么强强联手,Ningx + Resin 的搭配应该会胜过 Apache + Resin. 至少理论上是这样,然而理性的技术选型中,技术性能是一方面,也会考虑经济性,这也是一些互联网公司曾经有过的关于去 IOE (IBM, ORACLE和EMC,分别代表大规模计算, 数据处理和存储)的浪潮的一个依据。

在从计算机&IT业早期,我所接触的就是 Resin 作为Java的Application Server,多年过去之后,当我再次思考这个问题的时候,我的认识发生了改变,这次我选择了 Tomcat,而不是 Resin,经济是一方面,其开源和社区属性应该是另外一面,相应地性能优势已经不是那么明显。
由于硬件性能几十年来一直以摩尔定律(单位面积上的集成电路晶体管数量每18-24个月翻一倍,性能提升而价格-成本下降)的速度在发展,如果纯粹的开源软件无需考虑这些,而如果是以一定的成本购买来的性能提升,是否该软件带来的性能提升速度能够跟得上硬件摩尔定律的发展?
设若以1000$的硬件运行A软件(1000$)获得性能为1000个并发,B软件(0$)为500个并发;一两年后,1000$的硬件自然地能够运行B软件(0$)获得1000个并发。此时如果A软件(1000$)相应地预期应该能够获得2000个并发,如果不能,我们认为这笔开支是不理性的。实际运营需求,可能对性能的要求并没有快过硬件的摩尔定律式的发展。这一问题回归,就是花成本在购置软件上的获得性能提升是否值得或者经济,尤其是在分布式,云计算大行其道的情况下? 可能的场景是,如果现在花1000$购置某闭源软件带来+500个并发性能,而1-2年后,同样的硬件成本可以0$的获得+500个并发性能,此时额外的1000$到底该不该花?

决策时的另一个考虑是,无论是 Ningx 还是 Resin 其开源版本总是给人一种“阉割版”的印象,要想要更高级的功能,都需要花钱才能实现,这多少令人不爽。开源和闭源都可能打造较好的软件,但免费推出“阉割版”,然后根据高级功能收费,这种做法,在我看来是不合适的,只好对 Ningx 和 Resin 说再见,尽管他们在性能上有优秀的表现,我更相信对 Apache 和 Tomcat 的站队投资,能促使其不断成长、优化和改进,形成良性循环。

多年来,随着 -gMIS-GWA2 的成长、成熟,从软件开发者的角度,我越来越能理解到,一款所谓好的软件,就是有人不断地使用,不断地应对新的scenarios,不断地修正bugs,从而不断地健壮、丰富和强大。Apache, Tomcat 应该也是这样,软件发展注定会是马太效应,强者更强,弱者更弱,某个细分领域,某个独特场景下,最终可能只会存在1-2款软件。

几年前,在 -人民网 进行某个互联网项目前期调研时,其中对互联网应用的发展趋势,有个小结是,互联网因的越来越具有服务方式的排他性和内容格式的统一性——大白话就是某种应用(服务)只存在其本身就够了,天下无二;在其上,各种内容兼容并包,既有文字、图片、动画,也有音频和视频,基于这些小众内容分类创新也基本不用想了。

这是今次我这么选择 Apache + Tomcat 的原因。接下来继续回复关于在 Apache 和 Tomcat 下设置虚拟主机VirtualHost的细节。

2. Tomcat 的虚拟主机配置
虚拟主机的配置,在以前的blog里提到过,”apache, resin, ssl对虚拟主机的支持”,  -R/12SY , 这次就不再重复在 Apache 里设置虚拟主机的情况,转而重点在 Tomcat 对虚拟主机的支持及设置情况.

Tomcat对虚拟主机的支持,官方文档和网上教程也有一些,下面是一个小结。

在 Tomcat 的 conf/server.xml 中,在
<Server>
    –> <Service>
        –> <Engine>
            –> <Host> 
中并列地新增一个 <Host> 标记即可。例如,默认的 <Host> 形式为

<Host name=”localhost” autoDeploy=”true” appBase=”webapps” …

在此之后,并列的新增一个针对虚拟主机的 <Host>设置,一般情况的形式为

<Host name=”srvXXX.ufqi.com” autoDeploy=”true” appBase=”/www/webroot/srvXXX”>
    <Context path=”” docBase=”/www/webroot/srvXXX”></Context>
    <!– something else –>
</Host>

其中 “<Context>” 需求强调的是,如果不通过其设置 docBase, 按 Tomcat的默认,则请求 http://srvXXX.ufqi.com/abc.jsp 时会将解析指向默认 <Host> 的默认 docBase ,通常是 默认 <Host> 的 appBase , 也即 webapps/ROOT .
通过 <Context> 设置新的 docBase之后,这可以解决这一解析寻址路径,再次请求 http://srvXXX.ufqi.com/abc.jsp 路径时,会按图索骥地在 /www/webroot/srvXXX 目录下进行寻找,从而能够获得预期的请求资源。

进一步地,由于 Tomcat 的部署默认对象单位是 application,所以即便不指定 docBase ,在 /www/webroot/srcXXX 子目录(application)下的相应资源是能够被准确定位的。上述情况,如果不指定 docBase , 通过访问路径 http://srvXXX.ufqi.com/pathX/abc.jsp 则是能够获得相应地资源的。

3. 对SSL 的支持
在设置相应的虚拟主机时,如果在 Apache 上启用了 SSL支持,可能一般情况下都会启用,而且以后会成为默认选项。
按 “apache, resin, ssl对虚拟主机的支持”,  -R/12SY  的描述需要在 Apache 的 conf/extra/http-ssl.conf 中做相应的设置,才能使得 Apache + Tomcat 对 SSL 的预期的支持。

发表在 服务器运维, 编程技术, 计算机技术 | 标签为 , , , | 留下评论

捐助乌克兰Help Ukraine老板选址BossXuanzhiUfqiFina有福金融UfqiWork有福工坊

-gMIS持续优化更新, +InSiteSearch站内搜索

-gMIS 部署和应用的场景越来越多,最近在考虑为所有gMIS承载管理的数据库系统增加一个站内搜索功能, +InSiteSearch 。前因是在 2017年11月份的更新中,我们设想“层级目录导航是“传统”的,属于 Yahoo 时代的产物,未来的导航应该是 Google 式的智能导航。
未来拟开发一个 gMIS 域内全文搜索引擎,这样用户就无需使用或者记录层级目录。” (-R/p2SM)。 约半年后,我们实现了这方面的一个探索。

主要动机可以类比为Yahoo时代的目录搜索与Google时代的全文检索,当 -gMIS 所管理的对象超过一定数量级后,管理人员面临的问题就自然而然地迷失在多层复杂的目录式的导航中,如何有效地定位到目标功能模块成为迫切需要解决的问题。(在Google出现之前,用户想找某个主题/关键词的内容,需要去Yahoo的站点目录里去逐层逐级的查找相应的站点,Yahoo提供的网站目录满足了当时的需求)

站内搜索也被称之为局域网搜索Intranet search /Onsite search有别于互联网搜索Internet search. 其目的是搜索网址内部通常不公开的,格式化或者非格式化的内容。-gMIS 针对此项的规划远景是集成一个智能助理。

  1. 站内搜索InSiteSearch主要思路

    格式化数据的搜索是一个老课题。相对于非格式化数据,比如常见的网页数据,格式化数据有得天独厚的优势,我们能确切的预先知道,数据的格式、类型与规模。
    在获得这些之后又该怎样实现站内搜索呢?
    大致有两个思路,列如下。

    一是将待搜索的数据,读取到某个index service上实现对数据的indexing,当有某种关键词进行搜索时,按indexing的数据进行相应数据的返回。
    这种方式,是事先、同步地将所有格式化数据同步到indexing 服务,并实现相应的增删改的操作同步。
    也即,在格式化数据库/表之外,需要独立的建立一套应对全文搜索的数据结构存储系统,通常为 keyword–>pagelist 结构,也即某个待搜索关键词会对应一个包含该关键词的文档列表,其中列表的排序规则为某个权重值,其主要指标是为了表名当前关键词与当前文档的依存关系。
    若无意外,该indexing的数据存储结果将同等尺寸于原始格式化数据。
    另外一种思路,也即,是否可以为待搜索的数据提供某种roadmap(路书、地图),当有某种关键词进行搜索时,知道在什么地方以什么方式进行搜索。而实际数据的增删改人保留在原数据库/表中,当下的站内搜索InSiteSearch只是提供某种ShortCut服务,该服务能够实现以较为经济的、智能的方式,帮助调用者以较合理地方式返回预期的搜索内容。
    可以设想,在这种思路下,系统不需要创建一套indexing服务,也不需要额外地复制全部格式化数据副本作为待检索的对象。
    也即,当触发在全域进行某个关键词进行搜索时,InSiteSearch知道该关键词最可能出现在某些数据表的数据字段项上,而不太可能出现在其他字段项或者其他数据表相应的字段项上。
    这种路书(地图)导引式的搜索辅助设施,将极大地提升搜索范围和搜索精度,在格式化数据的搜索上,很好的契合了搜索需求的应用场景。

    两相比较,在 -gMIS 中,我们选用了,基于路书的指引式站内搜索方式。

  2. 站内搜索InSiteSearch的实现方式

    依据前述讨论,我们在 -gMIS 中实现了基于导引式地站内搜索实现。其主要操作内容如下。
    A. 创建 insitesearch 表
    用于存储当有基于某个关键词进行搜索时,所依赖的数据表路径。
    insitesearch表的生成主要依赖 /act/insitesearchsort.php 程序。
    该程序读取当前数据库连接下的所有数据表,并分析每个数据表的每个字段,如果发现当前字段数据可被检索字符串类型,通常为char(4-255),则将该数据库、数据表的数据字段记为待检索字段。
    以此循环所有数据表的所有数据字段,生成待检索数据字段列表。
    当有待搜索关键词递交到系统程序时, /extra/insitesearch.php , 站内搜索引擎程序按图索骥地逐个待搜索数据库、数据表、数据字段的进行检索。
    根据当前页的size设置,搜索到N个结果时,自动返回给调用者,以此形成翻页功能。

    B. 增加站内搜索入口
    对应地,我们在 进入系统主页和list view识图页面,在顶部导航栏增加了对 站内搜索 的接入功能,若用户需要进行站全域站内搜索,只需将待搜索关键词递交给搜索模块即可实现该功能。

    C. 动态更新搜索源
    辅助地,我们在 

    Π 首页  桌面 & 系统配置 → 搜索源配置 | 搜索源配置 

    增加了对 搜索源的配置与管理,在该模块可以实现对待搜索列表的手工更新与配置。当有新的数据模块被手工添加到当前数据库时,可以通过 “更新搜索源列表” 来实现对待搜索资源列表的更新与维护。

    D. 精细化操作的黑白名单设置
    同样地,我们在

    Π 首页  桌面 & 系统配置 → 搜索源黑白名单 | 搜索源黑白名单

    额外地增加了对待搜索源的黑白名单设置,以满足特性的运营需求,比如当某个数据库的数据表的数据字段被程序规则判定为“黑名单”时,可以在此将相应的条件设置为允许“白名单”;同样地,当某个数据库的数据表的字段被程序判断为“白名单”而通过系统检测,可以在此将相应条件设置为“黑名单”,以阻止其进入待搜索队列。

  3. UI批量更新与优化
    单条记录更新模块,增加了行间距,当字段之间跟容易识别;
    字段名称加粗显示,区别与字段值、字段备注等信息;
    列表显示时,增加了 break-all 属性,数据表默认不再撑破窗口,在纵向滚动和横向滚动中选择其一,仍不能排除某些情况下,纵横项同时滚动的可能;
    更新GTAjax,修正增加对 Array.sort 的支持;
    增加对List View下的活跃记录的所有字段值加粗显示,响应鼠标事件;
    增加对JavaScript更多的异步调用,页面提速更快;
    bugfix for getSelectOption;
    +checkSQLKeyword
    +allow multiple order fields

  4. 增删改查搜算
    截至 InSiteSearch 功能发布以后, -gMIS 的核心功能已经由 增删改查 升级为 增删改查搜算 (Create, Retrieve, Update, Delete, +Search, +Statistics)。
    其中”搜” 指的是增加了站内搜索功能,而算 则是指 -gMIS 中的数据透视功能,可以轻易地实现对目标数据表的各种维度的数据统计计算功能。
    可以预见 -gMIS 将从普通的通用信息管理功能逐渐升级改进,增加更多的商业智能功能模块,为业务运营支撑提供更多的信息数据与决策支持。

  5. GitHub 被 Microsoft 收购
    会影响到 -gMIS 在 -Github 的托管与开源吗?

 

gmis-logo-201606

-gMIS 是一种基于 -GWA2 的通用管理信息系统(Management Information System)软件,具有可配置的输入和输出接口。
可以在其上构建各种管理应用软件系统,如
内容管理系统(CMS),客户资源管理(CRM), 企业资源计划管理(ERP),
办公自动化系统(OA)等, 以及各种行业应用管理系统软件,如
人力资源管理系统(HR),学生管理,档案管理,旅游管理,图书管理,
商品管理及业务运营支撑系统等等。
实现零代码开发、快速搭建各种管理信息系统(MIS).

-gMIS is a -GWA2 based Management Information System (MIS) software with configurable input and output interfaces.
Various management application software systems can be built on it, such as
Content Management System (CMS), Customer Resource Management (CRM), Enterprise Resource Planning Management (ERP),
Office automation systems (OA), as well as different industry application management system softwares, such as
Human Resource Management System (HR), Student Management, Archive Management, Tourism Management, Book Management,
Commodity management and business operations support systems, etc.
With zero code development, -gMIS can build a set of management information systems (MIS) software in a minute.

Lower Costs, Better Productivity.
降低成本, 提高效率.

发表在 -gMIS, 服务器运维, 编程技术, 计算机技术 | 标签为 , , , | 2条评论

UfqiNews有福常在Google Books亮月亮科技Apache Softwares

商业组织忠诚与职业道德

最近在读《Investments》(投资学, -R/G2SS )第十版,在其中“Excerpts from CFA Institute Standards of Professional Conduct”章节提到CFA对客户第一条要“Loyalty(忠诚)”,对雇主的要求中第一条也是要“Loyalty(忠诚)”。尤其是对客户的忠诚里,要求必须把客户利益的优先级放在自己的利益前面。这听起来与某些党派的对组织忠诚、先人后己的要求很相似,如果是这样,是不是觉得“党性”要求不那么苛刻?

顺着这个忠诚的话题,我捡了几个反例叙述,商业不忠诚及职业不道德的例子示以警示。

  1. 中介员工自己跳单
    做中介的最怕跳单,大意是在居间服务市场,买家和买家通过中介取得联系后自行交易,绕过了中介一方。这在中介市场是严重不允许的,中介居间费用也是中介赖以生存的源泉。所以如果买家、卖家任一方试图绕过中介进行跳单,必遭中介追诉。
    据闻眼下,有某中介组织员工可以自己设定跳单并私吞中介服务费用。当某员工履行职责引荐买家、卖家之后,撮合达成交易收取居间费用,但上报给中介组织的内容却是交易未达成,并以服务费打折、优惠为条件劝诱买、卖双方与自己保持一致的说辞。然后再通过某种方式取消此次买卖标的物的邀约。一切像没发生过一样。
    买家、卖家、中介员工三方均受益,而唯一受损的一方是中介组织。

    类似例子,似乎并不止于中介服务,其他组织中应该也存在,员工利用其组织平台谋取私利,并对组织谎报内容。

    以损害组织利益谋取私利实在罪有应得,却屡禁不绝,大致是人的本性使然,组织如何在一定程度上使之不能、不敢、不想这样?

    也据闻眼下有在不损害组织利益的情况下谋取私利,比如统计数据修改。

  2. 程序“魔法值”修改账单
    统计数据是组织进行商务活动所依赖的根本。实施统计数据修改,一般是内外勾结在一起进行。员工A与外部合作伙伴甲达成利益输送,员工A在其数据底层,通过修改日志、统计数据输出,将原本属于合作伙伴乙的收益算入到合作伙伴甲账上。进而,合作伙伴甲收到额外的空账后再分赃给员工A。
    表面上看,似乎天衣无缝一般。组织总账平衡,不多不少,员工A和合作伙伴甲都受益,唯一受损的是合作伙伴乙,但其并不知情。

    这一犯罪的实施,需要修改生产系统或者统计程序的源代码,而且要通过某种“魔法值”(未经定义的常量,语见《码出高效——阿里巴巴Java开发手册》,-R/92SP )来进行,也即所说的“后门”的一种。

    计算机程序代码通用规范中明确要求不能使用这种“魔法值”,而一些不遵守这样约定的软件通常以“高效”等要求直接在代码中使用这些魔法值,通过使用这样的“魔法值”来满足日益复杂多变的运营需求。久而久之陷入混乱的恶性循环,也为通过这样的“魔法值”修改来实施利益输送提供了温床。

    大型的软件及互联网企业,严格要求这一项,既有技术层面的代码规范、可读性要求,还有言下之意不允许额外的特例出现在代码层,从根本上杜绝了通过“魔法值”来实施犯罪。

    如果某些作业系统程序复杂、多变,且充满了“魔法值”,则这样的犯罪实施起来将得心应手,且死无对证。除了员工A和合作伙伴甲,无人知晓,而利益受损方合作伙伴乙并无感知,也不会发起追诉。

本质上,个体是趋利的,理性的思维又要求个体要遵守商业文明。个体选择扭曲价值观的不忠诚、犯罪,一定是群体的体制机制存在一定问题。列以上反例,大致也能从侧面显示商业环境的恶劣、人性的扭曲和制度的崩溃。

法国经济学家Thomas Piketty在其著作《Capital in the Twenty-First Century 》(21世纪资本)(-R/M2SM )中表示,社会财富正由拥有资产(土地、工厂、设备)等的“地主”向拥有知识与创新的“精英”转移,职业经理人将在财富分配中扮演越来越重要的角色,其对组织的忠诚度似乎也显得格外重要。

这种白手起家或靠发明创造而快速巨额致富成为可能的社会,被现任英国首相Theresa May在其演讲中称之为“MeritCracy”(-R/F2SO ),这似乎是对经济学家的发现的印证。 

经理人或员工是人,人本性是自私的,如果一个组织不能抑私扬善,职务犯罪则防不胜防,组织最终将溃于一个个自私的蚁穴。就像一个社会,如果不能弘扬正义、彰显公平,各种犯罪则愈演愈烈,社会最终将泯灭于一件件自私的犯罪下。

发表在 社会生活 | 标签为 , , , , | 留下评论

UfqiNews有福常在Google Books亮月亮科技Apache Softwares