* 那我找个适合的男朋友同居,住他的房子, - [186] () (0)  (0)
     a 他们老是A我,我觉得他们觉得我是男生,因为我的中文名字是中性的 - [93] () (0)  (0)
     a 我其实不是同性恋,但是在女孩子圈子做事情,就是这样子,要讨好老妈 - [115] () (0)  (0)
     a 我上学的时候身材很好,就是这样子 - [111] () (0)  (0)
          b 但是学的专业不对,就是这样子 - [97] () (0)  (0)
     a 我一直住在自己家,我妈妈天天A我 - [101] () (0)  (0)
     a 想疯了,我要凹凸有致,家里房产多套,帮你做事,拼命赚钱 - [99] () (0)  (0)
     a A他的钱,让他给我妈妈送钱,一个月2000起码 - [61] () (0)  (0)
     a A是什么意思?操的意思吗? - [62] () (1)  (0)
          b 哈哈哈,这个没有试过,但据说别人都是这么干的 - [101] () (0)  (0)
     a 我可以帮他做事,他要拿钱给我妈 - [99] () (0)  (0)
     a 严重忧郁症的表现,天天说自己有多少间房干什么?和别人没关系 - [98] () (0)  (0)
          b 关你什么事,我省吃俭用,才有今天 - [92] () (0)  (0)
          b 为什么不说了,我家的钱是天上飘来的吗,是我花了多少心血 - [85] () (0)  (0)
               c 如果我有孩子女儿的话,他们肯定不食人间烟火 - [94] () (0)  (0)
          b 你们试试一下,从衣食无忧,从小绘画和上补习班,成绩都是95分以上,到今天 - [108] () (0)  (0)
               c 我本来不在乎,开心就好,出了社会,看看我妈受的苦吧 - [100] () (0)  (0)
                    d 出了社会就要实在一点,考虑的会更加全面,要考虑家庭发展 - [82] () (0)  (0)
     a 我弟弟的老婆,不是就看上我弟弟的高颜值,和吃苦耐劳对感情从一而终 - [89] () (0)  (0)
          b 但是我觉得还是必须创业,这样子下去不行,我不想我弟弟的老婆和我弟弟离婚 - [76] () (0)  (0)
               c 我是没有办法,我也是被逼的,我能怎么办,如果他们离婚了,我会很难过 - [84] () (0)  (0)
     a 我也没有办法,我妈妈喜欢的东西我未必喜欢,但是这就是现实了,他们那么努力的工作买房 - [109] () (0)  (0)
          b 希望我有个好的生活,但是人生哪里有那么多的捷径,所以他们非常努力 - [91] () (0)  (0)
          b 但是我知道Max的身份是假的,就是这样子,他带我去看他家西区的房产就是这样子 - [90] () (0)  (0)
          b 他们不是一个人,我是这么觉得的,微信和见到的人不是一个人,见到的人身家过亿 - [74] () (0)  (0)
          b 我觉得我跟他是天壤之别,就是这样子,必须靠自己努力,走好自己的人生,Max还是很低调的 - [95] () (0)  (0)
               c MAX他的学历太高了,太有钱了,我觉得他加我微信就是试探我,他那么花钱 - [71] () (0)  (0)
               c 说实在的我的确就是过的还不如他家宠物好,亿万富豪的孩子 - [83] () (0)  (0)
     a 我得罪你了吗?骂我白痴,三八,十三点 - [84] () (0)  (0)
          b 还骂我SB和垃圾,我得罪了人吗? - [88] () (0)  (0)
               c 骂我13点是14伤,有意思吗 - [74] () (0)  (0)
          b 还骂我1887,问我挂科是二货,挂科受伤,说我是小富二代, - [93] () (0)  (0)
               c 还说什么35,删我?我有什么办法,我生病上医院了 - [104] () (0)  (0)
                    d 我在医院呆着了,我无法面对自己 - [87] () (0)  (0)
                         e 我的确挺懒的,但是我的确要经手那么多东西,我家全部东西我都要经手,虽然我饿着肚子,是问我没有工作吗? - [105] () (0)  (0)
               c 还说什么6278 - [96] () (0)  (0)
                    d 天天骂我13是什么意思 - [79] () (0)  (0)
                         e 还要我打电话给多伦多律师楼的律师,要我去找他?什么47,24等等等? 还562,还975,就气你? - [59] () (0)  (0)
                              f 什么ph26 m1s 5h6 - [80] () (0)  (0)
                                   g m1v 5n1 4photo 什么03033 - [82] () (0)  (0)
                                        h 还有38 529 - [102] () (0)  (0)
                              f 你至少想做我生意吧? - [112] () (0)  (0)
                    d 还什么14169869537 - [99] () (0)  (0)
                         e 什么169 26 2018 - [103] () (0)  (0)
                              f 还什么 187 我感觉我的邮件全部被黑客入侵 - [107] () (0)  (0)
                                   g 我的所有文件代码包括账单都被黑客入侵了,账单是点点点 - [149] () (0)  (0)
                                        h 我之前进了医院就是因为这件事情,住院几个月,医生说我有病,但是我的文件代码是真的被改了 - [85] () (0)  (0)
                                             i 他们不相信我但是我的账单的确被黑了 - [111] () (0)  (0)
                                                  j 我想把ebill 发给租客,但是账单开起来都是点,所以我非常害怕,我进了医院吃了2年多的药 - [94] () (0)  (0)
                                        h 他们一点都不相信我,一点说有有毛病 - [76] () (0)  (0)
                                             i 我又是害怕,怕的睡不着觉,所以我进了医院不止一次 - [99] () (0)  (0)
                                                  j 吃药以后,我就开始发胖 - [86] () (0)  (0)
                                                       k 还什么378768 - [100] () (0)  (0)
                                                            l 什么8188 5312.07 - [86] () (0)  (0)
     a 什么127.57,197.53,96.96 - [87] () (0)  (0)
          b 什么1807,JD到底是什么意思 - [103] () (0)  (0)
               c 8729 5032? - [77] () (0)  (0)
                    d 为什么是这样子的 - [106] () (0)  (0)
                         e 653.85 和34.42? - [96] () (0)  (0)
                         e 从那时候起,我就开始生病吃药,本来还好,健健康康开朗的一个人 - [105] () (0)  (0)
                              f 然后我进了医院就浪费了几年时间,也不好意思跟朋友联系 - [78] () (0)  (0)
               c

我写了那么多report

- [141] () (0)  (0)

We are going to discuss the background information we used. The idea of matching words from
multiple documents is inherently complex due to the sophistication of human language. For example
in the English dictionary, there are many words that map to multiple definitions. This provides a
challenge when attempting to match text and meaning. One way of dealing with this is proposed
by Berry et al, which is using Latent Semantic Indexing (LSI) [2]. LSI is an information retrieval
method that uses Singular Value Decomposition (SVD) to identify patterns between terms and
concepts in a set of texts. So in order to implement LSI, a matrix must be construct whose
elements are each of the terms in the various documents. For example denote
A = [aij ]
where aij denotes the frequency in which term i occurs in document j. This means that A is likely
to be a very sparse matrix because most documents do not contain every word we are searching
for. After creating a term by document matrix,we can compute the SVD of this matrix, create
the database of singular values and vectors for retrieval, and match user queries to documents.
In addition, constructing a dictionary vector which containing all the words in documents are
helpful. The singular value decomposition (SVD) will estimate the structure in word usage across
documents.
We also need to create a m 1 query vector q. Inside the vector q, the position of the number
1 in an entry represents the term occurs once in the query vector. For purposes of information
retrieval, a user’s query can be represented as a vector q in k-dimensional or n-dimensional space.
A query (like a document) is a set of words. The length of the query vector q will be k or n.
The number in the query vector represents the occurrence of a specific word in the dictionary. For
example, the user query can be represented by
q = q
TUk
1
k
The query vector will used to compared with all existing document vectors in the matrix A and and
find most relevant documents.For example, the most relevant to query terms could be computed
by y = AT
q, but actually we approach the result in a different way.
Furthermore, we will use measure the cosine between the query vector and document vector
to find the similarity between them since there may be documents that are more relevant than
another. Using the value of cosine as a measure tells us what’s the better match. For example, the

回复  
                    d 明明是我写的report,我研究的,为什么我找不到工作 - [103] () (0)  (0)
                         e 我要发泄 - [135] () (0)  (0)
                              f 当然不是裙子,不然别人觉得我是同性恋 - [87] () (0)  (0)
                              f 你们不知道,在女孩子圈子混,只能这样子 - [91] () (0)  (0)
                              f 新版本 - [98] () (0)  (0)
                              f 我当年是班花,系花,死全家 - [55] () (0)  (0)
                         e 明明是我研究的,那哥们就改改好吗 - [100] () (0)  (0)
                              f 死王八蛋 - [118] () (0)  (0)
                              f 还要问我怎么写,为什么这么写,明明就是这样子,但是他的code写的比我好 - [102] () (0)  (0)
     a 改写的不错 - [115] () (0)  (0)
          b 我居然找不到工作,求助无门,可能因为我是移民1.5代的关系,我想尽办法,过上更好的生活 - [136] () (0)  (0)
               c 我全程靠自己,包括花钱 - [95] () (0)  (0)
               c 其实我胖了工作方便,我如果工作不可以太瘦 - [87] () (0)  (0)
                    d 什么凹凸有致都不适合,上班不适合 - [94] () (0)  (0)
               c 庄重成熟比较重要 - [90] () (0)  (0)
     a 人生就是这样子了,饿死全家,就好好管理房产吧,认清现实 - [78] () (0)  (0)
          b 找不到工作会死,肯定会死,家里7套房产,我非常在意 - [92] () (0)  (0)
               c 你叫我怎么下来,你叫我怎么不精神出轨,你叫我怎么不工作 - [89] () (0)  (0)
                    d 我当然不肯找对象结婚,这就是现实,我讨厌死汇率 - [87] () (0)  (0)
                         e 我没有工作,我这辈子不可能将就,宁可自己去创业就是这样子 - [93] () (0)  (0)
                              f 这一生就是这样子,我没有工作,没有事业,这一生顶多管理多套房产,我去投稿,freelancer - [90] () (0)  (0)
                                   g 你们当我写文章是玩的,不能赚钱吗? 虽然稿费不多 - [103] () (0)  (0)
                                        h 现在已经不是17年前了,就是这样子,我父母还在赚钱 - [112] () (0)  (0)
                                             i 我没有办法,温哥华就是这个样子,那你们告诉我我家7套房产,学了那么多语言和程序语言,长得不错该怎么办 - [86] () (0)  (0)
                                                  j 我一年家庭租金20多万 - [60] () (0)  (0)
                                                  j 我想逃离温哥华,不要在这里再受到任何虐待 - [72] () (0)  (0)
                                                       k 我想回到中国,我认清自己的价值,就是这样子 - [40] () (0)  (0)
                                                            l 我实在受不了,我好想把房产卖了就直接回到中国,就是这样子,这就是现实 - [85] () (0)  (0)
                                                                 m 在中国做个千万富翁的生活比在加拿大无业做蓝领的生活好多少 - [62] () (0)  (0)
                                                                      n 拼命逼我,在加拿大拼命逼我,逼疯我,不把我逼到自杀不甘心 - [88] () (0)  (0)
                                                                      n 逼迫我拿20每小时的工资搞我,你当我是傻逼 - [106] () (0)  (0)
                                                                           o 我努力的目的,只能是把加拿大变成中国而已,努力有用吗? - [81] () (0)  (0)
                                                                                p 在温哥华有什么意义?在多伦多有什么意义?能告诉我,为什么把一套房产变成生意,为什么不 - [108] () (0)  (0)