]> git.kernelconcepts.de Git - karo-tx-linux.git/blob - block/bsg.c
block: introduce new block status code type
[karo-tx-linux.git] / block / bsg.c
1 /*
2  * bsg.c - block layer implementation of the sg v4 interface
3  *
4  * Copyright (C) 2004 Jens Axboe <axboe@suse.de> SUSE Labs
5  * Copyright (C) 2004 Peter M. Jones <pjones@redhat.com>
6  *
7  *  This file is subject to the terms and conditions of the GNU General Public
8  *  License version 2.  See the file "COPYING" in the main directory of this
9  *  archive for more details.
10  *
11  */
12 #include <linux/module.h>
13 #include <linux/init.h>
14 #include <linux/file.h>
15 #include <linux/blkdev.h>
16 #include <linux/poll.h>
17 #include <linux/cdev.h>
18 #include <linux/jiffies.h>
19 #include <linux/percpu.h>
20 #include <linux/uio.h>
21 #include <linux/idr.h>
22 #include <linux/bsg.h>
23 #include <linux/slab.h>
24
25 #include <scsi/scsi.h>
26 #include <scsi/scsi_ioctl.h>
27 #include <scsi/scsi_cmnd.h>
28 #include <scsi/scsi_device.h>
29 #include <scsi/scsi_driver.h>
30 #include <scsi/sg.h>
31
32 #define BSG_DESCRIPTION "Block layer SCSI generic (bsg) driver"
33 #define BSG_VERSION     "0.4"
34
35 struct bsg_device {
36         struct request_queue *queue;
37         spinlock_t lock;
38         struct list_head busy_list;
39         struct list_head done_list;
40         struct hlist_node dev_list;
41         atomic_t ref_count;
42         int queued_cmds;
43         int done_cmds;
44         wait_queue_head_t wq_done;
45         wait_queue_head_t wq_free;
46         char name[20];
47         int max_queue;
48         unsigned long flags;
49 };
50
51 enum {
52         BSG_F_BLOCK             = 1,
53 };
54
55 #define BSG_DEFAULT_CMDS        64
56 #define BSG_MAX_DEVS            32768
57
58 #undef BSG_DEBUG
59
60 #ifdef BSG_DEBUG
61 #define dprintk(fmt, args...) printk(KERN_ERR "%s: " fmt, __func__, ##args)
62 #else
63 #define dprintk(fmt, args...)
64 #endif
65
66 static DEFINE_MUTEX(bsg_mutex);
67 static DEFINE_IDR(bsg_minor_idr);
68
69 #define BSG_LIST_ARRAY_SIZE     8
70 static struct hlist_head bsg_device_list[BSG_LIST_ARRAY_SIZE];
71
72 static struct class *bsg_class;
73 static int bsg_major;
74
75 static struct kmem_cache *bsg_cmd_cachep;
76
77 /*
78  * our internal command type
79  */
80 struct bsg_command {
81         struct bsg_device *bd;
82         struct list_head list;
83         struct request *rq;
84         struct bio *bio;
85         struct bio *bidi_bio;
86         int err;
87         struct sg_io_v4 hdr;
88 };
89
90 static void bsg_free_command(struct bsg_command *bc)
91 {
92         struct bsg_device *bd = bc->bd;
93         unsigned long flags;
94
95         kmem_cache_free(bsg_cmd_cachep, bc);
96
97         spin_lock_irqsave(&bd->lock, flags);
98         bd->queued_cmds--;
99         spin_unlock_irqrestore(&bd->lock, flags);
100
101         wake_up(&bd->wq_free);
102 }
103
104 static struct bsg_command *bsg_alloc_command(struct bsg_device *bd)
105 {
106         struct bsg_command *bc = ERR_PTR(-EINVAL);
107
108         spin_lock_irq(&bd->lock);
109
110         if (bd->queued_cmds >= bd->max_queue)
111                 goto out;
112
113         bd->queued_cmds++;
114         spin_unlock_irq(&bd->lock);
115
116         bc = kmem_cache_zalloc(bsg_cmd_cachep, GFP_KERNEL);
117         if (unlikely(!bc)) {
118                 spin_lock_irq(&bd->lock);
119                 bd->queued_cmds--;
120                 bc = ERR_PTR(-ENOMEM);
121                 goto out;
122         }
123
124         bc->bd = bd;
125         INIT_LIST_HEAD(&bc->list);
126         dprintk("%s: returning free cmd %p\n", bd->name, bc);
127         return bc;
128 out:
129         spin_unlock_irq(&bd->lock);
130         return bc;
131 }
132
133 static inline struct hlist_head *bsg_dev_idx_hash(int index)
134 {
135         return &bsg_device_list[index & (BSG_LIST_ARRAY_SIZE - 1)];
136 }
137
138 static int blk_fill_sgv4_hdr_rq(struct request_queue *q, struct request *rq,
139                                 struct sg_io_v4 *hdr, struct bsg_device *bd,
140                                 fmode_t has_write_perm)
141 {
142         struct scsi_request *req = scsi_req(rq);
143
144         if (hdr->request_len > BLK_MAX_CDB) {
145                 req->cmd = kzalloc(hdr->request_len, GFP_KERNEL);
146                 if (!req->cmd)
147                         return -ENOMEM;
148         }
149
150         if (copy_from_user(req->cmd, (void __user *)(unsigned long)hdr->request,
151                            hdr->request_len))
152                 return -EFAULT;
153
154         if (hdr->subprotocol == BSG_SUB_PROTOCOL_SCSI_CMD) {
155                 if (blk_verify_command(req->cmd, has_write_perm))
156                         return -EPERM;
157         } else if (!capable(CAP_SYS_RAWIO))
158                 return -EPERM;
159
160         /*
161          * fill in request structure
162          */
163         req->cmd_len = hdr->request_len;
164
165         rq->timeout = msecs_to_jiffies(hdr->timeout);
166         if (!rq->timeout)
167                 rq->timeout = q->sg_timeout;
168         if (!rq->timeout)
169                 rq->timeout = BLK_DEFAULT_SG_TIMEOUT;
170         if (rq->timeout < BLK_MIN_SG_TIMEOUT)
171                 rq->timeout = BLK_MIN_SG_TIMEOUT;
172
173         return 0;
174 }
175
176 /*
177  * Check if sg_io_v4 from user is allowed and valid
178  */
179 static int
180 bsg_validate_sgv4_hdr(struct sg_io_v4 *hdr, int *op)
181 {
182         int ret = 0;
183
184         if (hdr->guard != 'Q')
185                 return -EINVAL;
186
187         switch (hdr->protocol) {
188         case BSG_PROTOCOL_SCSI:
189                 switch (hdr->subprotocol) {
190                 case BSG_SUB_PROTOCOL_SCSI_CMD:
191                 case BSG_SUB_PROTOCOL_SCSI_TRANSPORT:
192                         break;
193                 default:
194                         ret = -EINVAL;
195                 }
196                 break;
197         default:
198                 ret = -EINVAL;
199         }
200
201         *op = hdr->dout_xfer_len ? REQ_OP_SCSI_OUT : REQ_OP_SCSI_IN;
202         return ret;
203 }
204
205 /*
206  * map sg_io_v4 to a request.
207  */
208 static struct request *
209 bsg_map_hdr(struct bsg_device *bd, struct sg_io_v4 *hdr, fmode_t has_write_perm)
210 {
211         struct request_queue *q = bd->queue;
212         struct request *rq, *next_rq = NULL;
213         int ret;
214         unsigned int op, dxfer_len;
215         void __user *dxferp = NULL;
216         struct bsg_class_device *bcd = &q->bsg_dev;
217
218         /* if the LLD has been removed then the bsg_unregister_queue will
219          * eventually be called and the class_dev was freed, so we can no
220          * longer use this request_queue. Return no such address.
221          */
222         if (!bcd->class_dev)
223                 return ERR_PTR(-ENXIO);
224
225         dprintk("map hdr %llx/%u %llx/%u\n", (unsigned long long) hdr->dout_xferp,
226                 hdr->dout_xfer_len, (unsigned long long) hdr->din_xferp,
227                 hdr->din_xfer_len);
228
229         ret = bsg_validate_sgv4_hdr(hdr, &op);
230         if (ret)
231                 return ERR_PTR(ret);
232
233         /*
234          * map scatter-gather elements separately and string them to request
235          */
236         rq = blk_get_request(q, op, GFP_KERNEL);
237         if (IS_ERR(rq))
238                 return rq;
239         scsi_req_init(rq);
240
241         ret = blk_fill_sgv4_hdr_rq(q, rq, hdr, bd, has_write_perm);
242         if (ret)
243                 goto out;
244
245         if (op == REQ_OP_SCSI_OUT && hdr->din_xfer_len) {
246                 if (!test_bit(QUEUE_FLAG_BIDI, &q->queue_flags)) {
247                         ret = -EOPNOTSUPP;
248                         goto out;
249                 }
250
251                 next_rq = blk_get_request(q, REQ_OP_SCSI_IN, GFP_KERNEL);
252                 if (IS_ERR(next_rq)) {
253                         ret = PTR_ERR(next_rq);
254                         next_rq = NULL;
255                         goto out;
256                 }
257                 rq->next_rq = next_rq;
258
259                 dxferp = (void __user *)(unsigned long)hdr->din_xferp;
260                 ret =  blk_rq_map_user(q, next_rq, NULL, dxferp,
261                                        hdr->din_xfer_len, GFP_KERNEL);
262                 if (ret)
263                         goto out;
264         }
265
266         if (hdr->dout_xfer_len) {
267                 dxfer_len = hdr->dout_xfer_len;
268                 dxferp = (void __user *)(unsigned long)hdr->dout_xferp;
269         } else if (hdr->din_xfer_len) {
270                 dxfer_len = hdr->din_xfer_len;
271                 dxferp = (void __user *)(unsigned long)hdr->din_xferp;
272         } else
273                 dxfer_len = 0;
274
275         if (dxfer_len) {
276                 ret = blk_rq_map_user(q, rq, NULL, dxferp, dxfer_len,
277                                       GFP_KERNEL);
278                 if (ret)
279                         goto out;
280         }
281
282         return rq;
283 out:
284         scsi_req_free_cmd(scsi_req(rq));
285         blk_put_request(rq);
286         if (next_rq) {
287                 blk_rq_unmap_user(next_rq->bio);
288                 blk_put_request(next_rq);
289         }
290         return ERR_PTR(ret);
291 }
292
293 /*
294  * async completion call-back from the block layer, when scsi/ide/whatever
295  * calls end_that_request_last() on a request
296  */
297 static void bsg_rq_end_io(struct request *rq, blk_status_t status)
298 {
299         struct bsg_command *bc = rq->end_io_data;
300         struct bsg_device *bd = bc->bd;
301         unsigned long flags;
302
303         dprintk("%s: finished rq %p bc %p, bio %p\n",
304                 bd->name, rq, bc, bc->bio);
305
306         bc->hdr.duration = jiffies_to_msecs(jiffies - bc->hdr.duration);
307
308         spin_lock_irqsave(&bd->lock, flags);
309         list_move_tail(&bc->list, &bd->done_list);
310         bd->done_cmds++;
311         spin_unlock_irqrestore(&bd->lock, flags);
312
313         wake_up(&bd->wq_done);
314 }
315
316 /*
317  * do final setup of a 'bc' and submit the matching 'rq' to the block
318  * layer for io
319  */
320 static void bsg_add_command(struct bsg_device *bd, struct request_queue *q,
321                             struct bsg_command *bc, struct request *rq)
322 {
323         int at_head = (0 == (bc->hdr.flags & BSG_FLAG_Q_AT_TAIL));
324
325         /*
326          * add bc command to busy queue and submit rq for io
327          */
328         bc->rq = rq;
329         bc->bio = rq->bio;
330         if (rq->next_rq)
331                 bc->bidi_bio = rq->next_rq->bio;
332         bc->hdr.duration = jiffies;
333         spin_lock_irq(&bd->lock);
334         list_add_tail(&bc->list, &bd->busy_list);
335         spin_unlock_irq(&bd->lock);
336
337         dprintk("%s: queueing rq %p, bc %p\n", bd->name, rq, bc);
338
339         rq->end_io_data = bc;
340         blk_execute_rq_nowait(q, NULL, rq, at_head, bsg_rq_end_io);
341 }
342
343 static struct bsg_command *bsg_next_done_cmd(struct bsg_device *bd)
344 {
345         struct bsg_command *bc = NULL;
346
347         spin_lock_irq(&bd->lock);
348         if (bd->done_cmds) {
349                 bc = list_first_entry(&bd->done_list, struct bsg_command, list);
350                 list_del(&bc->list);
351                 bd->done_cmds--;
352         }
353         spin_unlock_irq(&bd->lock);
354
355         return bc;
356 }
357
358 /*
359  * Get a finished command from the done list
360  */
361 static struct bsg_command *bsg_get_done_cmd(struct bsg_device *bd)
362 {
363         struct bsg_command *bc;
364         int ret;
365
366         do {
367                 bc = bsg_next_done_cmd(bd);
368                 if (bc)
369                         break;
370
371                 if (!test_bit(BSG_F_BLOCK, &bd->flags)) {
372                         bc = ERR_PTR(-EAGAIN);
373                         break;
374                 }
375
376                 ret = wait_event_interruptible(bd->wq_done, bd->done_cmds);
377                 if (ret) {
378                         bc = ERR_PTR(-ERESTARTSYS);
379                         break;
380                 }
381         } while (1);
382
383         dprintk("%s: returning done %p\n", bd->name, bc);
384
385         return bc;
386 }
387
388 static int blk_complete_sgv4_hdr_rq(struct request *rq, struct sg_io_v4 *hdr,
389                                     struct bio *bio, struct bio *bidi_bio)
390 {
391         struct scsi_request *req = scsi_req(rq);
392         int ret = 0;
393
394         dprintk("rq %p bio %p 0x%x\n", rq, bio, req->result);
395         /*
396          * fill in all the output members
397          */
398         hdr->device_status = req->result & 0xff;
399         hdr->transport_status = host_byte(req->result);
400         hdr->driver_status = driver_byte(req->result);
401         hdr->info = 0;
402         if (hdr->device_status || hdr->transport_status || hdr->driver_status)
403                 hdr->info |= SG_INFO_CHECK;
404         hdr->response_len = 0;
405
406         if (req->sense_len && hdr->response) {
407                 int len = min_t(unsigned int, hdr->max_response_len,
408                                         req->sense_len);
409
410                 ret = copy_to_user((void __user *)(unsigned long)hdr->response,
411                                    req->sense, len);
412                 if (!ret)
413                         hdr->response_len = len;
414                 else
415                         ret = -EFAULT;
416         }
417
418         if (rq->next_rq) {
419                 hdr->dout_resid = req->resid_len;
420                 hdr->din_resid = scsi_req(rq->next_rq)->resid_len;
421                 blk_rq_unmap_user(bidi_bio);
422                 blk_put_request(rq->next_rq);
423         } else if (rq_data_dir(rq) == READ)
424                 hdr->din_resid = req->resid_len;
425         else
426                 hdr->dout_resid = req->resid_len;
427
428         /*
429          * If the request generated a negative error number, return it
430          * (providing we aren't already returning an error); if it's
431          * just a protocol response (i.e. non negative), that gets
432          * processed above.
433          */
434         if (!ret && req->result < 0)
435                 ret = req->result;
436
437         blk_rq_unmap_user(bio);
438         scsi_req_free_cmd(req);
439         blk_put_request(rq);
440
441         return ret;
442 }
443
444 static bool bsg_complete(struct bsg_device *bd)
445 {
446         bool ret = false;
447         bool spin;
448
449         do {
450                 spin_lock_irq(&bd->lock);
451
452                 BUG_ON(bd->done_cmds > bd->queued_cmds);
453
454                 /*
455                  * All commands consumed.
456                  */
457                 if (bd->done_cmds == bd->queued_cmds)
458                         ret = true;
459
460                 spin = !test_bit(BSG_F_BLOCK, &bd->flags);
461
462                 spin_unlock_irq(&bd->lock);
463         } while (!ret && spin);
464
465         return ret;
466 }
467
468 static int bsg_complete_all_commands(struct bsg_device *bd)
469 {
470         struct bsg_command *bc;
471         int ret, tret;
472
473         dprintk("%s: entered\n", bd->name);
474
475         /*
476          * wait for all commands to complete
477          */
478         io_wait_event(bd->wq_done, bsg_complete(bd));
479
480         /*
481          * discard done commands
482          */
483         ret = 0;
484         do {
485                 spin_lock_irq(&bd->lock);
486                 if (!bd->queued_cmds) {
487                         spin_unlock_irq(&bd->lock);
488                         break;
489                 }
490                 spin_unlock_irq(&bd->lock);
491
492                 bc = bsg_get_done_cmd(bd);
493                 if (IS_ERR(bc))
494                         break;
495
496                 tret = blk_complete_sgv4_hdr_rq(bc->rq, &bc->hdr, bc->bio,
497                                                 bc->bidi_bio);
498                 if (!ret)
499                         ret = tret;
500
501                 bsg_free_command(bc);
502         } while (1);
503
504         return ret;
505 }
506
507 static int
508 __bsg_read(char __user *buf, size_t count, struct bsg_device *bd,
509            const struct iovec *iov, ssize_t *bytes_read)
510 {
511         struct bsg_command *bc;
512         int nr_commands, ret;
513
514         if (count % sizeof(struct sg_io_v4))
515                 return -EINVAL;
516
517         ret = 0;
518         nr_commands = count / sizeof(struct sg_io_v4);
519         while (nr_commands) {
520                 bc = bsg_get_done_cmd(bd);
521                 if (IS_ERR(bc)) {
522                         ret = PTR_ERR(bc);
523                         break;
524                 }
525
526                 /*
527                  * this is the only case where we need to copy data back
528                  * after completing the request. so do that here,
529                  * bsg_complete_work() cannot do that for us
530                  */
531                 ret = blk_complete_sgv4_hdr_rq(bc->rq, &bc->hdr, bc->bio,
532                                                bc->bidi_bio);
533
534                 if (copy_to_user(buf, &bc->hdr, sizeof(bc->hdr)))
535                         ret = -EFAULT;
536
537                 bsg_free_command(bc);
538
539                 if (ret)
540                         break;
541
542                 buf += sizeof(struct sg_io_v4);
543                 *bytes_read += sizeof(struct sg_io_v4);
544                 nr_commands--;
545         }
546
547         return ret;
548 }
549
550 static inline void bsg_set_block(struct bsg_device *bd, struct file *file)
551 {
552         if (file->f_flags & O_NONBLOCK)
553                 clear_bit(BSG_F_BLOCK, &bd->flags);
554         else
555                 set_bit(BSG_F_BLOCK, &bd->flags);
556 }
557
558 /*
559  * Check if the error is a "real" error that we should return.
560  */
561 static inline int err_block_err(int ret)
562 {
563         if (ret && ret != -ENOSPC && ret != -ENODATA && ret != -EAGAIN)
564                 return 1;
565
566         return 0;
567 }
568
569 static ssize_t
570 bsg_read(struct file *file, char __user *buf, size_t count, loff_t *ppos)
571 {
572         struct bsg_device *bd = file->private_data;
573         int ret;
574         ssize_t bytes_read;
575
576         dprintk("%s: read %zd bytes\n", bd->name, count);
577
578         bsg_set_block(bd, file);
579
580         bytes_read = 0;
581         ret = __bsg_read(buf, count, bd, NULL, &bytes_read);
582         *ppos = bytes_read;
583
584         if (!bytes_read || err_block_err(ret))
585                 bytes_read = ret;
586
587         return bytes_read;
588 }
589
590 static int __bsg_write(struct bsg_device *bd, const char __user *buf,
591                        size_t count, ssize_t *bytes_written,
592                        fmode_t has_write_perm)
593 {
594         struct bsg_command *bc;
595         struct request *rq;
596         int ret, nr_commands;
597
598         if (count % sizeof(struct sg_io_v4))
599                 return -EINVAL;
600
601         nr_commands = count / sizeof(struct sg_io_v4);
602         rq = NULL;
603         bc = NULL;
604         ret = 0;
605         while (nr_commands) {
606                 struct request_queue *q = bd->queue;
607
608                 bc = bsg_alloc_command(bd);
609                 if (IS_ERR(bc)) {
610                         ret = PTR_ERR(bc);
611                         bc = NULL;
612                         break;
613                 }
614
615                 if (copy_from_user(&bc->hdr, buf, sizeof(bc->hdr))) {
616                         ret = -EFAULT;
617                         break;
618                 }
619
620                 /*
621                  * get a request, fill in the blanks, and add to request queue
622                  */
623                 rq = bsg_map_hdr(bd, &bc->hdr, has_write_perm);
624                 if (IS_ERR(rq)) {
625                         ret = PTR_ERR(rq);
626                         rq = NULL;
627                         break;
628                 }
629
630                 bsg_add_command(bd, q, bc, rq);
631                 bc = NULL;
632                 rq = NULL;
633                 nr_commands--;
634                 buf += sizeof(struct sg_io_v4);
635                 *bytes_written += sizeof(struct sg_io_v4);
636         }
637
638         if (bc)
639                 bsg_free_command(bc);
640
641         return ret;
642 }
643
644 static ssize_t
645 bsg_write(struct file *file, const char __user *buf, size_t count, loff_t *ppos)
646 {
647         struct bsg_device *bd = file->private_data;
648         ssize_t bytes_written;
649         int ret;
650
651         dprintk("%s: write %zd bytes\n", bd->name, count);
652
653         if (unlikely(uaccess_kernel()))
654                 return -EINVAL;
655
656         bsg_set_block(bd, file);
657
658         bytes_written = 0;
659         ret = __bsg_write(bd, buf, count, &bytes_written,
660                           file->f_mode & FMODE_WRITE);
661
662         *ppos = bytes_written;
663
664         /*
665          * return bytes written on non-fatal errors
666          */
667         if (!bytes_written || err_block_err(ret))
668                 bytes_written = ret;
669
670         dprintk("%s: returning %zd\n", bd->name, bytes_written);
671         return bytes_written;
672 }
673
674 static struct bsg_device *bsg_alloc_device(void)
675 {
676         struct bsg_device *bd;
677
678         bd = kzalloc(sizeof(struct bsg_device), GFP_KERNEL);
679         if (unlikely(!bd))
680                 return NULL;
681
682         spin_lock_init(&bd->lock);
683
684         bd->max_queue = BSG_DEFAULT_CMDS;
685
686         INIT_LIST_HEAD(&bd->busy_list);
687         INIT_LIST_HEAD(&bd->done_list);
688         INIT_HLIST_NODE(&bd->dev_list);
689
690         init_waitqueue_head(&bd->wq_free);
691         init_waitqueue_head(&bd->wq_done);
692         return bd;
693 }
694
695 static void bsg_kref_release_function(struct kref *kref)
696 {
697         struct bsg_class_device *bcd =
698                 container_of(kref, struct bsg_class_device, ref);
699         struct device *parent = bcd->parent;
700
701         if (bcd->release)
702                 bcd->release(bcd->parent);
703
704         put_device(parent);
705 }
706
707 static int bsg_put_device(struct bsg_device *bd)
708 {
709         int ret = 0, do_free;
710         struct request_queue *q = bd->queue;
711
712         mutex_lock(&bsg_mutex);
713
714         do_free = atomic_dec_and_test(&bd->ref_count);
715         if (!do_free) {
716                 mutex_unlock(&bsg_mutex);
717                 goto out;
718         }
719
720         hlist_del(&bd->dev_list);
721         mutex_unlock(&bsg_mutex);
722
723         dprintk("%s: tearing down\n", bd->name);
724
725         /*
726          * close can always block
727          */
728         set_bit(BSG_F_BLOCK, &bd->flags);
729
730         /*
731          * correct error detection baddies here again. it's the responsibility
732          * of the app to properly reap commands before close() if it wants
733          * fool-proof error detection
734          */
735         ret = bsg_complete_all_commands(bd);
736
737         kfree(bd);
738 out:
739         kref_put(&q->bsg_dev.ref, bsg_kref_release_function);
740         if (do_free)
741                 blk_put_queue(q);
742         return ret;
743 }
744
745 static struct bsg_device *bsg_add_device(struct inode *inode,
746                                          struct request_queue *rq,
747                                          struct file *file)
748 {
749         struct bsg_device *bd;
750 #ifdef BSG_DEBUG
751         unsigned char buf[32];
752 #endif
753
754         if (!blk_queue_scsi_passthrough(rq)) {
755                 WARN_ONCE(true, "Attempt to register a non-SCSI queue\n");
756                 return ERR_PTR(-EINVAL);
757         }
758
759         if (!blk_get_queue(rq))
760                 return ERR_PTR(-ENXIO);
761
762         bd = bsg_alloc_device();
763         if (!bd) {
764                 blk_put_queue(rq);
765                 return ERR_PTR(-ENOMEM);
766         }
767
768         bd->queue = rq;
769
770         bsg_set_block(bd, file);
771
772         atomic_set(&bd->ref_count, 1);
773         mutex_lock(&bsg_mutex);
774         hlist_add_head(&bd->dev_list, bsg_dev_idx_hash(iminor(inode)));
775
776         strncpy(bd->name, dev_name(rq->bsg_dev.class_dev), sizeof(bd->name) - 1);
777         dprintk("bound to <%s>, max queue %d\n",
778                 format_dev_t(buf, inode->i_rdev), bd->max_queue);
779
780         mutex_unlock(&bsg_mutex);
781         return bd;
782 }
783
784 static struct bsg_device *__bsg_get_device(int minor, struct request_queue *q)
785 {
786         struct bsg_device *bd;
787
788         mutex_lock(&bsg_mutex);
789
790         hlist_for_each_entry(bd, bsg_dev_idx_hash(minor), dev_list) {
791                 if (bd->queue == q) {
792                         atomic_inc(&bd->ref_count);
793                         goto found;
794                 }
795         }
796         bd = NULL;
797 found:
798         mutex_unlock(&bsg_mutex);
799         return bd;
800 }
801
802 static struct bsg_device *bsg_get_device(struct inode *inode, struct file *file)
803 {
804         struct bsg_device *bd;
805         struct bsg_class_device *bcd;
806
807         /*
808          * find the class device
809          */
810         mutex_lock(&bsg_mutex);
811         bcd = idr_find(&bsg_minor_idr, iminor(inode));
812         if (bcd)
813                 kref_get(&bcd->ref);
814         mutex_unlock(&bsg_mutex);
815
816         if (!bcd)
817                 return ERR_PTR(-ENODEV);
818
819         bd = __bsg_get_device(iminor(inode), bcd->queue);
820         if (bd)
821                 return bd;
822
823         bd = bsg_add_device(inode, bcd->queue, file);
824         if (IS_ERR(bd))
825                 kref_put(&bcd->ref, bsg_kref_release_function);
826
827         return bd;
828 }
829
830 static int bsg_open(struct inode *inode, struct file *file)
831 {
832         struct bsg_device *bd;
833
834         bd = bsg_get_device(inode, file);
835
836         if (IS_ERR(bd))
837                 return PTR_ERR(bd);
838
839         file->private_data = bd;
840         return 0;
841 }
842
843 static int bsg_release(struct inode *inode, struct file *file)
844 {
845         struct bsg_device *bd = file->private_data;
846
847         file->private_data = NULL;
848         return bsg_put_device(bd);
849 }
850
851 static unsigned int bsg_poll(struct file *file, poll_table *wait)
852 {
853         struct bsg_device *bd = file->private_data;
854         unsigned int mask = 0;
855
856         poll_wait(file, &bd->wq_done, wait);
857         poll_wait(file, &bd->wq_free, wait);
858
859         spin_lock_irq(&bd->lock);
860         if (!list_empty(&bd->done_list))
861                 mask |= POLLIN | POLLRDNORM;
862         if (bd->queued_cmds < bd->max_queue)
863                 mask |= POLLOUT;
864         spin_unlock_irq(&bd->lock);
865
866         return mask;
867 }
868
869 static long bsg_ioctl(struct file *file, unsigned int cmd, unsigned long arg)
870 {
871         struct bsg_device *bd = file->private_data;
872         int __user *uarg = (int __user *) arg;
873         int ret;
874
875         switch (cmd) {
876                 /*
877                  * our own ioctls
878                  */
879         case SG_GET_COMMAND_Q:
880                 return put_user(bd->max_queue, uarg);
881         case SG_SET_COMMAND_Q: {
882                 int queue;
883
884                 if (get_user(queue, uarg))
885                         return -EFAULT;
886                 if (queue < 1)
887                         return -EINVAL;
888
889                 spin_lock_irq(&bd->lock);
890                 bd->max_queue = queue;
891                 spin_unlock_irq(&bd->lock);
892                 return 0;
893         }
894
895         /*
896          * SCSI/sg ioctls
897          */
898         case SG_GET_VERSION_NUM:
899         case SCSI_IOCTL_GET_IDLUN:
900         case SCSI_IOCTL_GET_BUS_NUMBER:
901         case SG_SET_TIMEOUT:
902         case SG_GET_TIMEOUT:
903         case SG_GET_RESERVED_SIZE:
904         case SG_SET_RESERVED_SIZE:
905         case SG_EMULATED_HOST:
906         case SCSI_IOCTL_SEND_COMMAND: {
907                 void __user *uarg = (void __user *) arg;
908                 return scsi_cmd_ioctl(bd->queue, NULL, file->f_mode, cmd, uarg);
909         }
910         case SG_IO: {
911                 struct request *rq;
912                 struct bio *bio, *bidi_bio = NULL;
913                 struct sg_io_v4 hdr;
914                 int at_head;
915
916                 if (copy_from_user(&hdr, uarg, sizeof(hdr)))
917                         return -EFAULT;
918
919                 rq = bsg_map_hdr(bd, &hdr, file->f_mode & FMODE_WRITE);
920                 if (IS_ERR(rq))
921                         return PTR_ERR(rq);
922
923                 bio = rq->bio;
924                 if (rq->next_rq)
925                         bidi_bio = rq->next_rq->bio;
926
927                 at_head = (0 == (hdr.flags & BSG_FLAG_Q_AT_TAIL));
928                 blk_execute_rq(bd->queue, NULL, rq, at_head);
929                 ret = blk_complete_sgv4_hdr_rq(rq, &hdr, bio, bidi_bio);
930
931                 if (copy_to_user(uarg, &hdr, sizeof(hdr)))
932                         return -EFAULT;
933
934                 return ret;
935         }
936         /*
937          * block device ioctls
938          */
939         default:
940 #if 0
941                 return ioctl_by_bdev(bd->bdev, cmd, arg);
942 #else
943                 return -ENOTTY;
944 #endif
945         }
946 }
947
948 static const struct file_operations bsg_fops = {
949         .read           =       bsg_read,
950         .write          =       bsg_write,
951         .poll           =       bsg_poll,
952         .open           =       bsg_open,
953         .release        =       bsg_release,
954         .unlocked_ioctl =       bsg_ioctl,
955         .owner          =       THIS_MODULE,
956         .llseek         =       default_llseek,
957 };
958
959 void bsg_unregister_queue(struct request_queue *q)
960 {
961         struct bsg_class_device *bcd = &q->bsg_dev;
962
963         if (!bcd->class_dev)
964                 return;
965
966         mutex_lock(&bsg_mutex);
967         idr_remove(&bsg_minor_idr, bcd->minor);
968         if (q->kobj.sd)
969                 sysfs_remove_link(&q->kobj, "bsg");
970         device_unregister(bcd->class_dev);
971         bcd->class_dev = NULL;
972         kref_put(&bcd->ref, bsg_kref_release_function);
973         mutex_unlock(&bsg_mutex);
974 }
975 EXPORT_SYMBOL_GPL(bsg_unregister_queue);
976
977 int bsg_register_queue(struct request_queue *q, struct device *parent,
978                        const char *name, void (*release)(struct device *))
979 {
980         struct bsg_class_device *bcd;
981         dev_t dev;
982         int ret;
983         struct device *class_dev = NULL;
984         const char *devname;
985
986         if (name)
987                 devname = name;
988         else
989                 devname = dev_name(parent);
990
991         /*
992          * we need a proper transport to send commands, not a stacked device
993          */
994         if (!queue_is_rq_based(q))
995                 return 0;
996
997         bcd = &q->bsg_dev;
998         memset(bcd, 0, sizeof(*bcd));
999
1000         mutex_lock(&bsg_mutex);
1001
1002         ret = idr_alloc(&bsg_minor_idr, bcd, 0, BSG_MAX_DEVS, GFP_KERNEL);
1003         if (ret < 0) {
1004                 if (ret == -ENOSPC) {
1005                         printk(KERN_ERR "bsg: too many bsg devices\n");
1006                         ret = -EINVAL;
1007                 }
1008                 goto unlock;
1009         }
1010
1011         bcd->minor = ret;
1012         bcd->queue = q;
1013         bcd->parent = get_device(parent);
1014         bcd->release = release;
1015         kref_init(&bcd->ref);
1016         dev = MKDEV(bsg_major, bcd->minor);
1017         class_dev = device_create(bsg_class, parent, dev, NULL, "%s", devname);
1018         if (IS_ERR(class_dev)) {
1019                 ret = PTR_ERR(class_dev);
1020                 goto put_dev;
1021         }
1022         bcd->class_dev = class_dev;
1023
1024         if (q->kobj.sd) {
1025                 ret = sysfs_create_link(&q->kobj, &bcd->class_dev->kobj, "bsg");
1026                 if (ret)
1027                         goto unregister_class_dev;
1028         }
1029
1030         mutex_unlock(&bsg_mutex);
1031         return 0;
1032
1033 unregister_class_dev:
1034         device_unregister(class_dev);
1035 put_dev:
1036         put_device(parent);
1037         idr_remove(&bsg_minor_idr, bcd->minor);
1038 unlock:
1039         mutex_unlock(&bsg_mutex);
1040         return ret;
1041 }
1042 EXPORT_SYMBOL_GPL(bsg_register_queue);
1043
1044 static struct cdev bsg_cdev;
1045
1046 static char *bsg_devnode(struct device *dev, umode_t *mode)
1047 {
1048         return kasprintf(GFP_KERNEL, "bsg/%s", dev_name(dev));
1049 }
1050
1051 static int __init bsg_init(void)
1052 {
1053         int ret, i;
1054         dev_t devid;
1055
1056         bsg_cmd_cachep = kmem_cache_create("bsg_cmd",
1057                                 sizeof(struct bsg_command), 0, 0, NULL);
1058         if (!bsg_cmd_cachep) {
1059                 printk(KERN_ERR "bsg: failed creating slab cache\n");
1060                 return -ENOMEM;
1061         }
1062
1063         for (i = 0; i < BSG_LIST_ARRAY_SIZE; i++)
1064                 INIT_HLIST_HEAD(&bsg_device_list[i]);
1065
1066         bsg_class = class_create(THIS_MODULE, "bsg");
1067         if (IS_ERR(bsg_class)) {
1068                 ret = PTR_ERR(bsg_class);
1069                 goto destroy_kmemcache;
1070         }
1071         bsg_class->devnode = bsg_devnode;
1072
1073         ret = alloc_chrdev_region(&devid, 0, BSG_MAX_DEVS, "bsg");
1074         if (ret)
1075                 goto destroy_bsg_class;
1076
1077         bsg_major = MAJOR(devid);
1078
1079         cdev_init(&bsg_cdev, &bsg_fops);
1080         ret = cdev_add(&bsg_cdev, MKDEV(bsg_major, 0), BSG_MAX_DEVS);
1081         if (ret)
1082                 goto unregister_chrdev;
1083
1084         printk(KERN_INFO BSG_DESCRIPTION " version " BSG_VERSION
1085                " loaded (major %d)\n", bsg_major);
1086         return 0;
1087 unregister_chrdev:
1088         unregister_chrdev_region(MKDEV(bsg_major, 0), BSG_MAX_DEVS);
1089 destroy_bsg_class:
1090         class_destroy(bsg_class);
1091 destroy_kmemcache:
1092         kmem_cache_destroy(bsg_cmd_cachep);
1093         return ret;
1094 }
1095
1096 MODULE_AUTHOR("Jens Axboe");
1097 MODULE_DESCRIPTION(BSG_DESCRIPTION);
1098 MODULE_LICENSE("GPL");
1099
1100 device_initcall(bsg_init);